Minimale Phoneme für einen Conlang?

Ich entwerfe eine außerirdische Rasse mit begrenzten Artikulationspunkten, und es brachte mich zum Nachdenken, was die minimale Anzahl von Phonemen ist, die eine Sprache benötigt, um zu funktionieren? Das würde mir helfen, ihre Physiologie zu bestimmen?

Ich habe gesehen, ist eine Sprache mit zwei Phonemen machbar? aber das scheint zu begrenzt zu sein, und die Idee, binär zu sprechen, passt nicht zu meiner Vorstellung von dieser außerirdischen Rasse.

Um es nicht noch komplizierter zu machen, aber sind sprachlose Sprachen akzeptabel? Licht, Zeichen, magnetische oder elektrische Felder bis hin zu Formen einer biologischen HF oder dergleichen könnten ohne Phoneme verwendet werden. Das geschriebene Wort ist nur eine andere Art, eine gesprochene Sprache zu vermitteln, daher kann jede Form ohne Laute gültig sein.
Vielleicht möchten Sie sich auch den YouTube-Kanal von Film Theorists ansehen , da die Episode zu „I am Groot“ eine vollständige Sprache ist.
@JDługosz der Bibliothekar von Discworld verwendet eine ähnliche Sprache mit nur einem Wort: "ook". Es ist auch eine Programmiersprache . (OK, der Bibliothekar verwendet gelegentlich auch "eek", aber wirklich die überwiegende Mehrheit seiner Wörter ist "ook")
Bitte beachten Sie, dass Stack Exchange einen Stack hat, der sich speziell auf Constructed Languages ​​konzentriert . Wir stellen uns einer Vielzahl von Fragen, aber Sie würden dort wahrscheinlich eine bessere Antwort erhalten.
Der Morsecode hat nur 2 Töne (3, wenn Sie die längere Lücke einbeziehen) und nur 1 Tonart (nur die Dauer unterscheidet sich), bietet jedoch eine effektive Kommunikation, wenn auch langsamer als Sprache, wie wir sie kennen.
Es ist auch offensichtlich, dass alles binär mit 2 Tönen codiert werden kann.

Antworten (3)

Abhängig davon, wie Sie Phoneme zählen, ist die "Mindestanzahl von Phonemen, die für das Funktionieren einer Sprache erforderlich sind" offensichtlich entweder eins oder zwei.

In realen sprachlichen Beschreibungen weisen polynesische Sprachen kleine phonemische Bestände auf; zum Beispiel kommt Tahitian mit fünf Vokalen und neun Konsonanten aus (/a/, /e/, /i/, /o/, /u/, /p/, /t/, /m/, /n/, / f/, /v/, /ʔ/, /h/ und /r/) und Hawaiianisch kommt mit denselben fünf Vokalen und nur acht Konsonanten aus (indem es keine Verwendung für /f/ hat). Das hawaiianische Alphabet hat nur 13 Buchstaben: a, e, i, o, u, h, k, l, m, n, p, w und ʻ (das ʻokina genannt wird und verwendet wird, um den Knacklaut zu schreiben / ʔ / ). (Und ja, das ist die alphabetische Reihenfolge.) (Je nachdem, wer zählt, können das zehn Vokale sein, weil jeder von ihnen kurz und lang sein kann.)

Aufmerksame Leser haben bemerkt, dass ich im vorangegangenen Absatz über die Anzahl von Phonemen in sprachlichen Beschreibungen und nicht in Sprachen gesprochen habe . Sprachen haben keine Phoneme; Phoneme sind Elemente der Modelle, die wir von Sprachen machen. In der physischen Realität haben wir nur (Allo-) Phones : Phones sind die physischen Realitäten, Phoneme sind die abstrakten Modelle. Die Anzahl der Phoneme hängt zu einem großen Teil von den Prinzipien ab, die hinter einem bestimmten Sprachmodell stehen.

Um ein extremes Beispiel zu nennen, wie viele Vokale hat Mandarin-Chinesisch ? Nun, das hängt davon ab, wer zählt. Die kleinste Zahl, die ich gesehen habe, ist Null ( Modell von Edwin Pulleyblank ). Das Maximum ist 25 (mit /a/, /ə/, /i/, /u/, /y/, jeweils mit einem der vier Töne oder mit dem „Null“-Ton). Oder, für ein vielleicht bekannteres Beispiel, wie viele Vokale gibt es im klassischen Latein? Sind es fünf, die jeweils eine lange und eine kurze Version haben, oder sind es zehn, oder sind es elf? Wie viele Vokale gibt es im BBC-Englisch ? Die übliche Beschreibung (für uns Ausländer, die Englisch lernen) gibt 19 (neunzehn!) Vokale und Diphthonge plus 4 Quasi-Diphthonge an.

Um also ein Modell einer fremden Sprache zu erstellen, würde ich sagen, dass Sie mit drei Vokalen nichts falsch machen können (ein zentraler Vokal /a/, ein vorderer ungerundeter Vokal /e/ und ein hinterer gerundeter Vokal /o/ ), zwei Gleiter (/j/ und /w/) und eine kleine Gruppe von Konsonanten. Welche Konsonanten, das hängt von der Menge der Artikulationspunkte ab, die Sie akzeptieren; davon, ob Sie Stimmunterscheidungen akzeptieren (wie zwischen /p/ und /b/ oder zwischen /k/ und /g/) oder nicht; darauf, ob Sie Nasale akzeptieren oder nicht; usw.

Das ist eine so großartige Antwort, aber es beunruhigt mich, dass die außerirdische Rasse keine Vokale und keine Fähigkeit zum Gleiten haben wird. Etwas außerhalb des Bereichs der Frage, aber ist ein noch kleineres Inventar funktionsfähig?
@Pureferret: Das hängt sehr davon ab, was Sie meinen, wenn Sie sagen, dass ihre Sprache keine Vokale hat ... (Es gibt keine menschliche gesprochene Sprache, die nicht zumindest Oberflächenvokale hat , dh Allophone, die als Silbenkern fungieren.) Aber praktisch gesehen sollten Sie (zB in Excel oder LibreOffice Calc) mit verschiedenen phonemischen Inventaren und phonotaktischen Regeln spielen und sehen, ob Sie damit zufrieden sind, wie viele verschiedene ein- oder zweisilbige Wurzeln gebildet werden können. Oder generieren Sie Beispielwörter mit Awkwords .
Die außerirdische Rasse hat ein Pneumostoma, erzeugt aber keine Geräusche auf diese Weise, sondern verwendet ihr Äquivalent, das Äquivalent einer Radula, um zu kratzen und zu klopfen, um Geräusche zu machen. Ich werde mir Awkwords ansehen und sehen, ob irgendetwas klickt
@Pureferret: Vielleicht möchten Sie sich diese Antwort ansehen , die speziell das Problem der Darstellung einer außerirdischen Sprache betrifft, die einen außerirdischen Klangerzeugungsmechanismus verwendet. Grundsätzlich können Sie, anstatt die Alien-Sounds direkt darzustellen, die Rollen von Alien-Sounds auf die Rollen von menschlichen Sounds abbilden; Klänge, die ausgehalten werden können und den Kern elementarer Phonationssequenzen bilden, werden auf menschliche Vokale abgebildet, momentane Klänge, die nicht ausgehalten werden können, werden auf menschliche Anschläge abgebildet usw.

Theoretisch würde jede Zahl von 1 bis unendlich viele Phoneme für eine Sprache funktionieren.

Hier ist ein Überblick über die niedrigsten Zahlen und wie sie funktionieren würden

Unäre Sprache

Angenommen, Sie können zwischen Wörtern pausieren (auf eine Weise, die ihre eigenen Daten nicht codiert), funktioniert Unary, obwohl es wahrscheinlich sehr unpraktisch ist:

Das unäre Zahlensystem ist das einfachste Zahlensystem zur Darstellung natürlicher Zahlen: 1 , um eine Zahl N darzustellen, ein Symbol, das 1 darstellt, wird N-mal wiederholt. 2

Im unären System wird die Zahl 0 (Null) durch die leere Zeichenfolge dargestellt, dh das Fehlen eines Symbols. Die Zahlen 1, 2, 3, 4, 5, 6, ... werden unär dargestellt als 1, 11, 111, 1111, 11111, 111111, ...

-Wikipedia _

In dieser Sprache würde also 1 Ton das erste Wort widerspiegeln, 11 das zweite Wort usw. Die Komplikation tritt auf, wenn Wörter in einem Satz kombiniert werden, um komplexere Konzepte widerzuspiegeln:

Der Satz, der sich auf „1 11 111 1 111 1“ bezieht, könnte genug Komplikation codieren, wenn beispielsweise „1 11“ und „1 111“ mehr Informationen codieren als ihre Teile allein.

Ohne Pausen

Binär & Ternär

Wie Sie in den Fragen und Antworten gefunden haben , geht es ausführlich darauf ein, wie Binär funktioniert, und berührt auch Ternär.

Sie können diese Wörter sogar nach Häufigkeit der Verwendung komprimieren, indem Sie einfach denselben Trick anwenden, mit dem Unicode gespeichert wurde

Wie Sie sehen können, gibt es ein ähnliches Konzept, mehr als die Summe seiner Teile zu kodieren.

Auf ternär:

Tri-State lässt Sie die UTF-8-„Erweiterungsbits“ verschrotten oder gibt Ihnen ein anderes Symbol zum Spielen (jetzt log(26)/log(3)). Geschwindigkeits- oder Kompressionsgewinne so oder so.

Dies ist die "effizienteste" Anzahl von Phonemen, wenn wir eine Analogie in Bezug auf die Radix-Ökonomie machen , aber wie wir unten sehen, gibt es andere Überlegungen. Dies ist keine perfekte Analogie.

Mehr als 4 Phoneme

Mit mehr als 4 Phonemen können wir beginnen, kleinere Wörter zu betrachten und sogar, wie Kombinationen von Lauten zusammenarbeiten. Man könnte davon ausgehen, dass die häufigsten Wörter auch die kürzesten sind

Wenn Sie zum Beispiel eine beliebige Kombination der 4 Phoneme in einem 3-Phonem-Wort betrachten (unter der Annahme von einfachem Onset, Nucleus und Coda ), erhalten Sie

4 ! ( 4 3 ! ) = 24 , Wörter

Reicht das für eine Sprache? Ja, theoretisch. Denken Sie daran, dass dies davon ausgeht, dass, sagen wir, a, s, d and f unsere Phoneme darstellen, das fffein gültiges Wort ist, das möglicherweise nicht wirklich unterscheidbar ist von ff(beachten Sie, dass zwei Phonemwörter nicht Teil unserer Berechnung sind, aber möglicherweise und höchstwahrscheinlich immer noch in der existieren Sprache!).

Wie viele Wörter sind in einer Sprache erforderlich, um grundlegende Konzepte zu vermitteln? Wenn es mehr als 24 sind, brauchen wir mehr Phoneme. Glücklicherweise haben wir genau zu diesem Zweck die Swadesh-Liste , die behauptet, dass zum Beispiel 100/207/35 Wörter benötigt werden, um grundlegende Konzepte zu vermitteln.

Angesichts dieser Einschränkungen können wir wolframalpha verwenden , um uns die minimalen Phoneme mitzuteilen, um genügend 3-Phonem-Wörter zu bilden, um diese Konzepte zu vermitteln:

X ! ( X 3 ! ) > 100 , x = 5,7 oder ~6 Phoneme ,

X ! ( X 3 ! ) > 207 , x = 6,9 oder ~7 Phoneme ,

X ! ( X 3 ! ) > 35 , x = 4,3 oder ~5 Phoneme ,

Dies ergibt einen ungefähren Bereich für die minimale Anzahl unter Berücksichtigung der obigen Einschränkungen. Angesichts der Tatsache, dass Wörter, die länger und kürzer als 3 Phoneme sind, in Sprachen existieren können und existieren, ist dies keine absolute Grenze. Sie haben also möglicherweise nur 5 Phoneme, was 60 Wörter mit 3 Phonemen ergibt, und dann 40 Wörter mit 1, 2, 4 oder mehr Phonemen. Oder minimaler mit 4 Phonemen, 24 3-Phonem-Wörtern und mindestens 11 mit 1,2,4 oder mehr Phonemen.

4 ! ( 4 3 ) ! + 4 ! ( 4 2 ) ! + 4 ! ( 4 1 ) ! = 24 + 12 + 4 = 40 Wörter

Wie Sie sehen können, bedeutet das Einbeziehen der kürzeren Wörter, dass wir mit 4 Phonemen abrunden können, um die kleinste Liste (35) zu erhalten. Wenn wir dasselbe mit 5 Phonemen machen, fehlen uns 15 Wörter von 100, aber wenn wir 4-Phonem-Wörter hinzufügen, fehlen uns 3 Wörter von der längeren Liste. Wenn wir davon ausgehen, dass weit weniger Kombinationen gültige Wörter sind, werden noch längere Phonemkombinationen benötigt.

Abschluss

Eine beliebige Anzahl von Phonemen funktioniert, aber je nachdem, ob Sie 1, 2, 3 oder mehr auswählen, ändert sich, wie Sie die Sprache selbst konstruieren.

Kombiniert man komplexe Beugungen und Betonungen, erhöht sich die Informationsdichte auch ohne die mögliche Hinzufügung von Gestik/Mimik enorm.
@Rottweileronmarket-day. zugestimmt, aber dann würde ich sagen, du hast einfach mehr Phoneme an deinen Händen (Ohren?). So würde ich es zumindest versuchen und berechnen. B. A-stressed-FS und AFS unterscheiden sich um ein Phonem, weil Sie jetzt zwischen betont und unbetont unterscheiden.
Fair genug, das macht Sinn.
Du denkst nicht sehr "fremd". Sie gehen davon aus, dass der Kommunikationsmodus menschenähnliche Sprache ist, wenn sogar Menschen mindestens zwei andere Modi aufweisen (Zeichen und Pfeifen).
@JohnO Das brauche ich für diese Frage nicht ... dachte ja, Sie können das 'Phonem' beliebig machen, wenn Sie sich dadurch eher als 'Alien' fühlen.
Vielleicht möchten Sie irgendwo darin erwähnen, dass MORSECODE ein Beispiel für eine unäre Sprache ist. Morsecode ist einfach Signal oder kein Signal. Ton oder kein Ton. Es reicht jedoch aus, um komplexe Botschaften zu übermitteln. Übrigens auch dieses Internet, das alles vermittelt, was wir jetzt besprechen. TCP/IP ist asynchrone Übertragung von: Signal oder Stille. Dennoch kann man einen vollständigen Streaming-Film durchquetschen.
@PcMan Morsecode ist jedoch keine Sprache, sondern ein Code. Außerdem besteht es aus Punkten und Strichen, also nicht unär.
@Pureferret nein! Morsecode enthält keine Punkte und Bindestriche. Es enthält nur Stille oder Piepton . Ein Punkt ist nur ein kurzer Piepton, ein Bindestrich ist ein langer Piepton. gleicher Sound, nur relative Dauer. Und was soll dieser Unsinn, wo Sie einen "Code" von einer "Sprache" unterscheiden? Besonders eine konstruierte Sprache , nach der das OP fragt?
Ich stimme zu, für eine außerirdische Spezies kann es kaum einen Unterschied zwischen Code und Sprache geben. Jetzt bin ich jedoch unentschlossen, ob Morse unär oder binär ist, es scheint dort die Linie zu überspannen.
@Pureferret Cool, ich bin der Swadesh-Liste noch nie zuvor begegnet! Danke, dass du es aufgenommen hast. Ich wundere mich jedoch über die Behauptung, dass beabsichtigt war, "Wörter aufzulisten, die zur Vermittlung grundlegender Konzepte benötigt werden" ... die Wiki-Seite scheint zu behaupten, dass der Zweck der Liste eher darin besteht, Sprachen auf Ähnlichkeit miteinander zu vergleichen. Es gibt jedoch eine starke Überschneidung, denke ich. Ohnehin! Eine andere „Grundwort-/Ideenliste“, auf die ich gestoßen bin, heißt Natural Semantic Metalanguage oder NSM. Ist es Ihnen schon begegnet? Könnte nützlich sein.
@pcman ein Code oder eine Chiffre verschlüsselt die vorhandene Sprache. Deshalb ist im Morsecode jedes „Wort“ eigentlich ein Buchstabe.
@johno wenn es nur Piep und Pieeeeeep gibt, ist es binär. Wenn die Länge des Signaltons wichtig ist, ist es unär.
Das ist keine sehr gute Antwort. Eine gute Antwort würde sich auf die tatsächliche Linguistik beziehen, dies ist nur uninformierte Kombinatorik.
@AzorAhai-him- richtig. Ich bin mir nicht sicher, warum es so hoch gestimmt wurde.
Re: Morsezeichen. Es spielt keine Rolle, dass der IRL-Morsecode englische Buchstaben codiert, was zählt, ist, dass Sie mit einem Ton Bedeutungen codieren können , indem Sie allein die Verwendungsrate verwenden. Wenn eine Person gut genug trainiert ist, kann sie Morse "lesen", indem sie einfach die Pieptöne hört, sie muss es nicht aufschreiben. Sie können den Mittelsmann überspringen und diese einfach direkt als Wörter behandeln. Die Außerirdischen würden offensichtlich unterschiedliche Muster haben, wobei die häufigsten Wörter am kürzesten sind, z. B. '--'. für 'rock' oder so.
@rbarret An diesem Punkt sprichst du nicht über Morsecode. Das war mein einziger Punkt. Ansonsten hast du recht

Töne und Flexion

Theoretisch braucht man einen .

Ein Buchstabe kann durch Flexion mehrere Bedeutungen haben. Es existiert in vielen Sprachen. Eine unterschiedliche Beugung desselben Phonems kann ein Wort von einem anderen unterscheiden. Bei einer Sprache, die auf Phoneme beschränkt ist, werden sie die Unterschiede wahrscheinlich auf andere Weise ausdrücken, von denen die Beugung eine der ersten ist, die mir in den Sinn kommt. Aber Sie können sie möglicherweise sogar nur pfeifen lassen.

Sie denken vielleicht, dass es unmöglich oder zu schwierig ist, aber eine außerirdische Rasse, die damit aufgewachsen ist, kann die Unterschiede der Töne auf einer viel tieferen Ebene unterscheiden. Es ist der Unterschied zwischen einer unmusikalischen Person oder einem hochqualifizierten Musiker, nur dass sie, anstatt zu lernen, Tausende, wenn nicht Millionen/Milliarden Generationen von Evolution durchlaufen haben. Sie konnten so winzige Details in den Tönen unterscheiden, die ohne Elektronik unmöglich erscheinen würden. Dies kann bedeuten, dass ein einzelnes Phonem theoretisch mehr Informationen vermitteln kann als alle Phoneme in den menschlichen Sprachen.

Selbst wenn Sie eine menschenähnliche Sprache benötigen, können Sie einen Tonfall oder Tonfall hineingeben. Je nachdem, ob Sie eine menschenähnliche Sprache oder eine völlig fremde Sprache wünschen, lautet die Antwort zwei bzw. eins.

Wie unterscheidet sich ein Phonem mit unterschiedlichen Tönen und Beugungen von nur mehreren Phonemen?
@Pureferret, wenn Sie sagen, dass der Buchstabe E mit ag flach oder e flach ist, soweit ich das beurteilen kann, immer noch dasselbe Phonem, aber es kann Informationen vermitteln. Aber jemand, der sich auskennt, kann mich korrigieren.
@Trioxidane Phoneme: "jede der wahrnehmbar unterschiedlichen Klangeinheiten in einer bestimmten Sprache". Wenn Sie den Unterschied hören können, handelt es sich per Definition nicht um dasselbe Phonem. Somit sind der Buchstabe E mit g oder es zwei verschiedene Phoneme. Unterscheidet sich also ein 500 ms lang anhaltendes E von einem 520 ms lang anhaltenden E, wenn der Sprecher und der Zuhörer den Unterschied zwischen diesen beiden Längen erkennen können. Wenn sie keinen Unterschied wahrnehmen können, handelt es sich um dasselbe Phonem.
@PcMan das stimmt. Dennoch kann es eine gültige Antwort sein. Sie haben vielleicht viele Phoneme, aber es umgeht das Artikulationsproblem. Die Beugung wird jetzt auch im Kommentar der anderen Antwort vorgeschlagen, wodurch sie auch jeweils zu einem anderen Phonem werden.
@PcMan: Nein, selbst wenn Sie den Unterschied hören können, kann es immer noch dasselbe Phonem sein. Nur wenn Sie den Unterschied hören und zwei Wörter finden, die sich nur durch diesen Unterschied unterscheiden, können Sie sagen, dass Sie zwei unterschiedliche Phoneme haben. Vielleicht wäre im Englischen ein gutes Beispiel der Unterschied zwischen dem klaren [l] (wie in lean ) und dem dunklen [ɫ] (wie in all ); Sie sind klar voneinander getrennt, aber es gibt kein minimales Wortpaar, bei dem die Unterscheidung einen Unterschied macht (weil die beiden Allophone nicht im selben phonetischen Kontext erscheinen können).
@AlexP, das macht nur diese eine Sache anders, ist aber immer noch relevant für meine Antwort. Wie Sie darauf anspielen, ist es gültig, wenn Sie verschiedene Bedeutungen dafür unterscheiden können, was die Idee in meiner Antwort widerspiegelt. Jedes ist also ein anderes Phonem.
@Trioxidane: Ich habe yo PcMan geantwortet ... (Aber Phoneme sind sowieso abstrakte Einheiten, und Sie können beispielsweise auf Griechisch η , ή und als drei Phoneme oder als ein Phonem + einen von drei Tönen zählen .)