Stellen Sie sich ein Conlang vor, das für eine interstellare Übertragung an einen Empfänger entwickelt wurde, der es herausfinden muss.
Ich denke, es wird für den Zweck erfunden, formell und streng. Es wird nahtlos von mathematischer Notation oder Computeralgorithmen zur Angabe von Fakten über reale Dinge übergehen.
Wie viele verschiedene „Arten“ von Wörtern gibt es also neben den offensichtlichen Substantiven und Verben wirklich?
Weiß jemand etwas über Ontologiesprachen oder Lojban ? Ich frage mich, ob es universellere Kategorien gibt als die im Englischen verwendeten Wortarten.
Der Grund, warum ich frage, ist, dass die Anzahl der Kategorien direkt in meinem Szenario angezeigt wird. Es gibt keine Rechtschreibung im herkömmlichen Sinne, da die Übertragung nur aus einer Reihe von Zahlen besteht. Wörter werden einfach nummeriert, also wäre etwas wie Noun #42 die wörtliche Schreibweise. Entweder gibt es unterschiedliche Codes, die unterschiedliche Kategorien einführen, oder die Kategorie wird durch ihre Nummer impliziert: Wort #42 ist ein Substantiv, weil der Typ durch den Rest der Zahl modulo 7 (oder wie viele Typen wir brauchen) impliziert wird.
Außerdem gibt es keinen Unterschied zwischen dem, was wir unter Wörtern und Satzzeichen verstehen. Auch Gruppierungen und Trennzeichen benötigen eigene Codes und werden auf die gleiche Weise codiert.
Wortarten sind morphologische oder morphosyntaktische Klassen von Wörtern. Nicht alle Sprachen haben Wortarten, aber in denen, die dies tun, wie Latein oder Französisch oder Englisch, werden die Wortarten basierend auf ihren Beugungsmustern (oder deren Fehlen) und ihren zulässigen Kombinationen unterschieden.
(Für diejenigen von uns, die Erfahrung mit Compilern haben, sind die Wortarten vergleichbar mit den Klassen von Token, die vom Lexer erkannt werden, wie z. B. Bezeichner, Zahlen, Operatoren und Trennzeichen.)
Zum Beispiel gibt es im Lateinischen drei sehr unterschiedliche Flexionsmuster (verbale Konjugation, nominale Deklination und pronominale Deklination); Adverbien, Präpositionen und Konjunktionen haben keine Beugung, aber ihre zulässigen Kombinationen sind unterschiedlich (Adverbien mit Adjektiven oder Verben, Präpositionen mit Substantiven oder Nominalgruppen, Konjunktionen mit Nominalgruppen oder Sätzen). Grammatiker erstellen Tabellen mit Beugungsmustern und erlaubten Kombinationen; die Zellen der Tabelle sind die Wortarten.
Auf Englisch können wir beispielsweise den folgenden Klassifizierungsbaum erstellen:
Hat das Wort eine -ing - Form, eine Vergangenheitsform, kann es mit will eine Zukunftsform bilden ? Wenn ja, dann ist es ein gewöhnliches Verb . (Beispiele: sein, trinken, setzen, sehen, nehmen.)
Kann if andernfalls an derselben syntaktischen Position wie ein reguläres Verb erscheinen? Wenn ja, dann ist es ein Modalverb . (Beispiele: können, dürfen, sollen.)
Andernfalls:
Kann es ein Verb bestimmen? Wenn ja, dann ist es ein Adverb . (Beispiele: schnell, schnell, wahrhaftig, gut.)
Kann es als Subjekt eines Verbs fungieren? Wenn ja, dann ist es entweder ein Substantiv oder ein Pronomen :
Bezeichnet das Wort ein bestimmtes Objekt? Wenn ja, ist es ein Eigenname .
Kann es sonst durch ein Adjektiv bestimmt werden? Wenn ja, dann ist es ein Gattungsname .
Ansonsten ist es ein Pronomen . (Englische Pronomen können auch durch ihre besondere Beugung identifiziert werden.)
Kann es ein Substantiv bestimmen? Wenn ja, dann ist es entweder ein Artikel oder ein Adjektiv oder eine Ziffer :
Kann das Wort Vergleichsgrade bilden? (Rein morphologisch gesprochen – „einzigartiger“ ist morphologisch korrekt, obwohl logisch albern.) Wenn ja, ist es ein gewöhnliches Adjektiv .
Gehört das Wort ansonsten zu einer Klasse von Adjektiven, die mit Substantiven erscheinen müssen, die als Subjekte oder direkte Objekte verwendet werden? Wenn ja, dann ist es ein Artikel oder demonstrativ .
Drückt es andernfalls eine bestimmte Zahl aus? Wenn ja, dann ist es eine Ziffer .
Viele Wörter gehören zu mehr als einer dieser Klassen. Insbesondere die überwiegende Mehrheit der Substantive kann auch als Adjektiv fungieren und umgekehrt.
Muss das Wort andernfalls unmittelbar vor einem Substantiv oder einer Nominalgruppe oder unmittelbar nach einem Verb verwendet werden? Wenn ja, dann ist es eine Präposition .
Kann das Wort ansonsten verwendet werden, um Substantive oder Nominalgruppen oder Verben oder Sätze zu verbinden? Wenn ja, dann ist es eine Konjunktion .
Andernfalls haben Sie ein Wort gefunden, das von diesem Entscheidungsbaum nicht klassifiziert werden kann. (Tipp: Denken Sie an Interjektionen wie ah und oh .)
Im Englischen haben Verben ein anderes Beugungsmuster als Substantive, und beide haben ein anderes Beugungsmuster als Pronomen; Im Gegensatz zu Latein macht Englisch wenig oder gar keinen Unterschied zwischen Substantiven und Adjektiven (sie sind nicht wirklich unterschiedliche Wortarten im Englischen), aber Englisch hat Artikel. (Artikel funktionieren syntaktisch genau wie Demonstrativadjektive, mit dem Unterschied, dass eine Sprache Artikel hat, wenn es syntaktische Konstruktionen gibt, bei denen ein Artikel oder Demonstrativ unbedingt erforderlich ist, wobei das Etikett "Artikel" auf die Demonstrativpronomen angewendet wird, die die schwächste Bedeutung haben .)
In Sprachen mit reichhaltiger Morphologie ist die Unterscheidung zwischen Wortarten klar, und die Satzstruktur wird allein durch die Morphologie oder mit sehr geringer Hilfe der Wortstellung getragen.
Auf der anderen Seite haben isolierende Sprachen wie Mandarin keinerlei Beugung (oder fast keine); In solchen Sprachen ist der Begriff "Sprachteile" sehr verschwommen und wird mit dem Unterschied zwischen Schlüsselwörtern und gewöhnlichen Bezeichnern in Programmiersprachen vergleichbar. Englisch ist auf dem besten Weg dahin; Viele englische Wörter können entweder völlig unverändert als Substantive, Adjektive und Verben fungieren ("they go " -- Verb, "we had a go " -- Substantiv, "all systems are go " -- Adjektiv; oder "go to a place " -- Substantiv, " etwas platzieren " -- Verb; oder "einen Drink haben " -- Substantiv, " trinken ".etwas" -- Verb) oder mit wenig Veränderung ("red" -- Adjektiv oder Substantiv; "to redden"). In solchen Sprachen ohne Morphologie oder sehr wenig Morphologie ist die Unterscheidung zwischen Wortarten und der syntaktischen Struktur stark abgeschwächt von Sätzen wird durch die Wortreihenfolge dargestellt, ähnlich wie in Programmiersprachen.
Zum Beispiel bedeuten im Lateinischen "puer puellam vidit", "puellam puer vidit", "vidit puellam puer" usw. alle "[der] Junge sah [das] Mädchen", während im Englischen keine andere Wortstellung möglich ist, ohne das zu ändern Bedeutung oder macht die Äußerung unverständlich.
Wortarten sind wirklich eine künstliche Unterteilung, die von Menschen gewählt wurde, um die Struktur unserer Sprache zu erklären. Sie passen nicht immer perfekt zusammen. Nehmen wir als Beispiel Japanisch. Japanisch hat „Partikel“, das sind Wörter, die in keine bestimmte Kategorie passen, die wir Englischsprachigen erkennen. Es gibt auch die polysynthetischen Sprachen, bei denen ein einzelnes Wort das erfasst, was wir Englischsprachigen einen Satz nennen würden. Und natürlich haben wir im Englischen einige interessante Wörter wie einen bestimmten Kraftausdruck, der mit dem Buchstaben F beginnt und sich einer Kategorisierung entzieht (wie in diesem ausgesprochen NSFW- Clip von den Boondock Saints gezeigt wird ).
Eine interessante Option in Anlehnung an Ihre nummerierten Wörter ist die Betrachtung von Sprachen, die zur Beschreibung semantischer Webs wie RDF und OWL verwendet werden. RDF zum Beispiel ist bemerkenswert einfach. Es gibt drei Teile von "Sprache": Subjekte, Prädikate und Objekte. Subjekte und Prädikate sind immer "IRIs", die von Natur aus Ihren nummerierten Wörtern ähneln. Objekte sind entweder IRIs oder "Datentypwerte", die konkrete Werte wie Zahlen sind. Das ist alles, was dazu gehört, und dennoch kann es die Welt mit dem ganzen Geschmack jeder fortgeschritteneren Sprache beschreiben.
Natürlich würden sie es nicht als solches Bild schicken. Sie würden den Inhalt in einem anderen Format rendern, wie z. B. Turtle, das textbasiert und prägnanter ist und einfachere Parallelen zu einem interstellaren Kommunikationsformat aufweist:
<http://example.org/123> dc:subject <http://example.org/subject32> .
<http://example.org/subject32>
rdf:type ex:ExampleSubjects ;
dcrdf:valueString "Biology"@en , "EA32"^^ex:SubjectEncoding ;
OWL ist ähnlicher Natur, aber ziemlich faszinierend, weil es seine eigene Semantik ziemlich elegant beschreiben kann. Zum Beispiel könnten Sie tatsächlich eine Regel haben "Alle Wörter, die Gegenstand eines Satzes sind, sind auch Substantive". Diese Beziehungen können so regelmäßig spezifiziert werden, dass OWL-Benutzer "Reasoners" verwenden können, um Beziehungen zu ergänzen, die nicht explizit im Dokument niedergeschrieben wurden.
Die fantastische Kraft dieser Semantic-Web-Sprachen besteht darin, dass Sie, wenn jemand die Semantik dessen, was Wort Nr. 42 in einem bestimmten Konstrukt bedeuten soll, nicht angegeben hat, oder wenn es kein Wort gibt, das Ihren Anforderungen entspricht, eine Semantik dafür erfinden können. Sie können diese Semantik dann aufschreiben (typischerweise in einer OWL-Ontologie). Andere können diese Semantik lesen und algorithmisch darauf reagieren. Ich könnte also ein neues Wort #3.14 definieren, das Sie noch nie zuvor gesehen haben, und ich kann dies so tun, dass Sie eine Chance haben, zu verstehen, was ich damit gemeint habe!
Diese semantische Fähigkeit wäre extrem wichtig, wenn Zeitverzögerungen groß wären. Sprachen entwickeln sich im Laufe der Zeit, und wenn zwischen den Kommunikationen genügend Zeit vergeht, ist es vernünftig zu glauben, dass sich die Bedeutung von Noun # 42 für eine Kultur ändern könnte und nicht für die andere. Die Fähigkeit, zumindest zu versuchen, die Semantik dessen zu erfassen, was Sie sagen, wäre sehr wichtig, um diese Effekte zu bekämpfen.
Sprache lässt sich in mehrere Schichten unterteilen.
Semantik und Pragmatik sind sehr wenig verstandene Felder.
Um eine Übertragung von einer außerirdischen Spezies zu analysieren, müsste man bestimmen, was die Phonologie ist, dann durch jede Schicht gehen und versuchen, herauszufinden, wie die Teile auf gültige und ungültige Weise kombiniert werden können.
In Bezug auf die Wortarten befürchte ich, dass sich das Klassifizierungssystem je nach Sprache unterscheidet, da wir nicht nach einem universellen System klassifizieren, wir unterscheiden Wörter in dieselben Wortarten, die die Grammatik dieser Sprache verwendet .
Lojban (da Sie gefragt haben) hat keine unterschiedlichen Verben, Substantive, Adverbien und Adjektive. Es hat Prädikate wie „prenu“ (ist eine Person) oder „xamgu“ (ist gut). Man kann „le xamgu ku“ (das Ding, das gut ist) oder „le prenu ku“ (das Ding, das eine Person ist, oder einfach nur „Person“) sagen, und in bestimmten Fällen können viele dieser Partikel weggelassen werden, z. B. „ .i prenu cu xamgu“ (die Person ist gut) statt „.i le prenu ku cu xamgu“. Dieses Phänomen (die Argumente eines Prädikats) ist etwas wie Nominalphrasen im Englischen, aber die Sprache unterscheidet absolut nicht zwischen dem, was man als Verben und Adjektive betrachten könnte, noch sollten Sie versuchen, sie so zu klassifizieren.
Eine "Wortart" ist nur ein Klassifikationsschema, das von Forschern der Sprache auferlegt wird, um Wortklassen zu beschreiben. Diese Gruppen basieren auf der Grammatikfunktion dieser Wörter, und hier bekommen wir „Substantiv“ und „Verb“ und „Präposition“; sie beschreiben Klassen von Wörtern im Englischen. Aber Sie haben auch Substantive, die sich wie Verben verhalten ("Google that.") und viele weitere seltsame Konstruktionen, die dazu führen, dass jede "Wortart" bis ganz nach unten in ihre eigene Wortart zerlegt wird.
Es gibt also keine Zahl für die Summe „aller Arten von Wortarten“. Englisch hat eine Art Adverb; Japanisch hat drei. Sind das getrennte Wortarten oder nicht?
Nun, wenn Sie die Symbole in Ihrer Sprache klassifizieren möchten, gibt es eine ziemlich gute Anleitung. Der Kontakt von Carl Sagan löst genau das Problem, das Sie beschreiben; Sie müssen mit den ersten Prinzipien beginnen und diese in eine komplexe Sprache einbauen. SETI hat versucht, eine solche Botschaft zu erfinden, und es ist wirklich, wirklich schwer.
Wenn Sie Bilder verschicken können, brauchen Sie nur eine „Wortart“, das DING. Mit einem THING können Sie Substantive angeben; Sobald Sie ein Substantiv (ATOM) haben, können Sie ein "Gleichheitsding" (ATOM = ATOM) erstellen und dann von dort aus fortfahren und DINGE angeben, die Zahlen sind, Dinge zählen usw.
Sie können die Syntax verwenden, um Konzepte wie die Veränderung im Laufe der Zeit zu erklären ( PROTON = PROTON, ELEKTRON GEGENÜBER PROTON, PROTON + NEUTRON = NEUTRON, PROTON UND ELEKTRON = WASSERSTOFF), aber alles ist nur eine SACHE.
Wenn das zu handgewellt klingt ( weil es so ist ), sollten Sie sich vielleicht mit der Codierungstheorie befassen. Was Sie wirklich wollen, ist ein Komprimierungsalgorithmus / Paritätsalgorithmus, der Mathematik mit generischen Symbolen erklärt.
proton
(Substantiv, generisch), =
(eine Beziehung angeben), +
(eine Operation ausführen) ,
und ( )
(Struktur). Ja, das sind alles Wörter, die kodiert werden können; zu sagen, das bringt nichts.
AlexP
JDługosz
Katalysator
Nigel222
Nigel222
JDługosz