Wie viele Wortarten gibt es wirklich?

Stellen Sie sich ein Conlang vor, das für eine interstellare Übertragung an einen Empfänger entwickelt wurde, der es herausfinden muss.

Ich denke, es wird für den Zweck erfunden, formell und streng. Es wird nahtlos von mathematischer Notation oder Computeralgorithmen zur Angabe von Fakten über reale Dinge übergehen.

Wie viele verschiedene „Arten“ von Wörtern gibt es also neben den offensichtlichen Substantiven und Verben wirklich?

Weiß jemand etwas über Ontologiesprachen oder Lojban ? Ich frage mich, ob es universellere Kategorien gibt als die im Englischen verwendeten Wortarten.

Der Grund, warum ich frage, ist, dass die Anzahl der Kategorien direkt in meinem Szenario angezeigt wird. Es gibt keine Rechtschreibung im herkömmlichen Sinne, da die Übertragung nur aus einer Reihe von Zahlen besteht. Wörter werden einfach nummeriert, also wäre etwas wie Noun #42 die wörtliche Schreibweise. Entweder gibt es unterschiedliche Codes, die unterschiedliche Kategorien einführen, oder die Kategorie wird durch ihre Nummer impliziert: Wort #42 ist ein Substantiv, weil der Typ durch den Rest der Zahl modulo 7 (oder wie viele Typen wir brauchen) impliziert wird.

Außerdem gibt es keinen Unterschied zwischen dem, was wir unter Wörtern und Satzzeichen verstehen. Auch Gruppierungen und Trennzeichen benötigen eigene Codes und werden auf die gleiche Weise codiert.

Wortarten werden basierend auf ihren Beugungsmustern (oder deren Fehlen) und ihren zulässigen Kombinationen unterschieden. Beispielsweise gibt es im Lateinischen drei sehr unterschiedliche Flexionsmuster (verbale Konjugation, Nominal- und Pronominaldeklination); Adverbien, Präpositionen und Konjunktionen haben keine Beugung, aber ihre zulässigen Kombinationen sind unterschiedlich (Adverbien mit Adjektiven oder Verben, Präpositionen mit Substantiven oder Nominalgruppen, Konjunktionen mit Nominalgruppen oder Sätzen). Grammatiker erstellen Tabellen mit Beugungsmustern und erlaubten Kombinationen; die Zellen sind die Wortarten.
@AlexP Beachten Sie, dass es wie bei modernen Computersprachen und der mathematischen Notation keine Beugungen im Conlang gibt. Mir gefällt, wohin Sie gehen, wenn Sie die Grammatik bestimmen lassen, was als Wortarten gilt, wenn Sie dies zu einer vollständigen Antwort entwickeln möchten.
Nach welcher Sprache fragst du? Englisch? Latein?? Ihr weitgehend undefinierter Conlang??? Fragst du, ob es Universalien gibt???? Unklar und IMHO zu breit
Eine faszinierende und unbeantwortete Frage ist, ob es einen tiefen Grammatik- oder Sprachinstinkt gibt, der über dem Lernwillen eines Babys liegt, der fest in uns verankert ist. Wenn ja, ist es einzigartig menschlich oder ein universelles Säugetier?
Es lohnt sich, über einige Sprachen zu lesen, die nicht zur indogermanischen Familie gehören. Xhosa, Navaho, Thai, ... Jeder Versuch, die Universalien zu kodifizieren, ist gescheitert, doch jedes menschliche Baby wird alle menschlichen Sprachen lernen, die einen bedeutenden Teil seines oder ihres frühen Lebens ausmachen.
@nigel222 Es ist wahrscheinlich die Vielfalt der "Programme", die auf dem bereitgestellten Nural-Netzwerk gehandhabt werden können: Wie viele Schichten hat es, wie ist es strukturiert usw.

Antworten (4)

Wortarten sind morphologische oder morphosyntaktische Klassen von Wörtern. Nicht alle Sprachen haben Wortarten, aber in denen, die dies tun, wie Latein oder Französisch oder Englisch, werden die Wortarten basierend auf ihren Beugungsmustern (oder deren Fehlen) und ihren zulässigen Kombinationen unterschieden.

(Für diejenigen von uns, die Erfahrung mit Compilern haben, sind die Wortarten vergleichbar mit den Klassen von Token, die vom Lexer erkannt werden, wie z. B. Bezeichner, Zahlen, Operatoren und Trennzeichen.)

Zum Beispiel gibt es im Lateinischen drei sehr unterschiedliche Flexionsmuster (verbale Konjugation, nominale Deklination und pronominale Deklination); Adverbien, Präpositionen und Konjunktionen haben keine Beugung, aber ihre zulässigen Kombinationen sind unterschiedlich (Adverbien mit Adjektiven oder Verben, Präpositionen mit Substantiven oder Nominalgruppen, Konjunktionen mit Nominalgruppen oder Sätzen). Grammatiker erstellen Tabellen mit Beugungsmustern und erlaubten Kombinationen; die Zellen der Tabelle sind die Wortarten.

Auf Englisch können wir beispielsweise den folgenden Klassifizierungsbaum erstellen:

  1. Hat das Wort eine -ing - Form, eine Vergangenheitsform, kann es mit will eine Zukunftsform bilden ? Wenn ja, dann ist es ein gewöhnliches Verb . (Beispiele: sein, trinken, setzen, sehen, nehmen.)

  2. Kann if andernfalls an derselben syntaktischen Position wie ein reguläres Verb erscheinen? Wenn ja, dann ist es ein Modalverb . (Beispiele: können, dürfen, sollen.)

  3. Andernfalls:

    • Kann es ein Verb bestimmen? Wenn ja, dann ist es ein Adverb . (Beispiele: schnell, schnell, wahrhaftig, gut.)

    • Kann es als Subjekt eines Verbs fungieren? Wenn ja, dann ist es entweder ein Substantiv oder ein Pronomen :

      • Bezeichnet das Wort ein bestimmtes Objekt? Wenn ja, ist es ein Eigenname .

      • Kann es sonst durch ein Adjektiv bestimmt werden? Wenn ja, dann ist es ein Gattungsname .

      • Ansonsten ist es ein Pronomen . (Englische Pronomen können auch durch ihre besondere Beugung identifiziert werden.)

    • Kann es ein Substantiv bestimmen? Wenn ja, dann ist es entweder ein Artikel oder ein Adjektiv oder eine Ziffer :

      • Kann das Wort Vergleichsgrade bilden? (Rein morphologisch gesprochen – „einzigartiger“ ist morphologisch korrekt, obwohl logisch albern.) Wenn ja, ist es ein gewöhnliches Adjektiv .

      • Gehört das Wort ansonsten zu einer Klasse von Adjektiven, die mit Substantiven erscheinen müssen, die als Subjekte oder direkte Objekte verwendet werden? Wenn ja, dann ist es ein Artikel oder demonstrativ .

      • Drückt es andernfalls eine bestimmte Zahl aus? Wenn ja, dann ist es eine Ziffer .

    • Viele Wörter gehören zu mehr als einer dieser Klassen. Insbesondere die überwiegende Mehrheit der Substantive kann auch als Adjektiv fungieren und umgekehrt.

  4. Muss das Wort andernfalls unmittelbar vor einem Substantiv oder einer Nominalgruppe oder unmittelbar nach einem Verb verwendet werden? Wenn ja, dann ist es eine Präposition .

  5. Kann das Wort ansonsten verwendet werden, um Substantive oder Nominalgruppen oder Verben oder Sätze zu verbinden? Wenn ja, dann ist es eine Konjunktion .

  6. Andernfalls haben Sie ein Wort gefunden, das von diesem Entscheidungsbaum nicht klassifiziert werden kann. (Tipp: Denken Sie an Interjektionen wie ah und oh .)

Im Englischen haben Verben ein anderes Beugungsmuster als Substantive, und beide haben ein anderes Beugungsmuster als Pronomen; Im Gegensatz zu Latein macht Englisch wenig oder gar keinen Unterschied zwischen Substantiven und Adjektiven (sie sind nicht wirklich unterschiedliche Wortarten im Englischen), aber Englisch hat Artikel. (Artikel funktionieren syntaktisch genau wie Demonstrativadjektive, mit dem Unterschied, dass eine Sprache Artikel hat, wenn es syntaktische Konstruktionen gibt, bei denen ein Artikel oder Demonstrativ unbedingt erforderlich ist, wobei das Etikett "Artikel" auf die Demonstrativpronomen angewendet wird, die die schwächste Bedeutung haben .)

In Sprachen mit reichhaltiger Morphologie ist die Unterscheidung zwischen Wortarten klar, und die Satzstruktur wird allein durch die Morphologie oder mit sehr geringer Hilfe der Wortstellung getragen.

Auf der anderen Seite haben isolierende Sprachen wie Mandarin keinerlei Beugung (oder fast keine); In solchen Sprachen ist der Begriff "Sprachteile" sehr verschwommen und wird mit dem Unterschied zwischen Schlüsselwörtern und gewöhnlichen Bezeichnern in Programmiersprachen vergleichbar. Englisch ist auf dem besten Weg dahin; Viele englische Wörter können entweder völlig unverändert als Substantive, Adjektive und Verben fungieren ("they go " -- Verb, "we had a go " -- Substantiv, "all systems are go " -- Adjektiv; oder "go to a place " -- Substantiv, " etwas platzieren " -- Verb; oder "einen Drink haben " -- Substantiv, " trinken ".etwas" -- Verb) oder mit wenig Veränderung ("red" -- Adjektiv oder Substantiv; "to redden"). In solchen Sprachen ohne Morphologie oder sehr wenig Morphologie ist die Unterscheidung zwischen Wortarten und der syntaktischen Struktur stark abgeschwächt von Sätzen wird durch die Wortreihenfolge dargestellt, ähnlich wie in Programmiersprachen.

Zum Beispiel bedeuten im Lateinischen "puer puellam vidit", "puellam puer vidit", "vidit puellam puer" usw. alle "[der] Junge sah [das] Mädchen", während im Englischen keine andere Wortstellung möglich ist, ohne das zu ändern Bedeutung oder macht die Äußerung unverständlich.

Wortarten sind wirklich eine künstliche Unterteilung, die von Menschen gewählt wurde, um die Struktur unserer Sprache zu erklären. Sie passen nicht immer perfekt zusammen. Nehmen wir als Beispiel Japanisch. Japanisch hat „Partikel“, das sind Wörter, die in keine bestimmte Kategorie passen, die wir Englischsprachigen erkennen. Es gibt auch die polysynthetischen Sprachen, bei denen ein einzelnes Wort das erfasst, was wir Englischsprachigen einen Satz nennen würden. Und natürlich haben wir im Englischen einige interessante Wörter wie einen bestimmten Kraftausdruck, der mit dem Buchstaben F beginnt und sich einer Kategorisierung entzieht (wie in diesem ausgesprochen NSFW- Clip von den Boondock Saints gezeigt wird ).

Eine interessante Option in Anlehnung an Ihre nummerierten Wörter ist die Betrachtung von Sprachen, die zur Beschreibung semantischer Webs wie RDF und OWL verwendet werden. RDF zum Beispiel ist bemerkenswert einfach. Es gibt drei Teile von "Sprache": Subjekte, Prädikate und Objekte. Subjekte und Prädikate sind immer "IRIs", die von Natur aus Ihren nummerierten Wörtern ähneln. Objekte sind entweder IRIs oder "Datentypwerte", die konkrete Werte wie Zahlen sind. Das ist alles, was dazu gehört, und dennoch kann es die Welt mit dem ganzen Geschmack jeder fortgeschritteneren Sprache beschreiben.

RDF-Beispiel

Natürlich würden sie es nicht als solches Bild schicken. Sie würden den Inhalt in einem anderen Format rendern, wie z. B. Turtle, das textbasiert und prägnanter ist und einfachere Parallelen zu einem interstellaren Kommunikationsformat aufweist:

<http://example.org/123>  dc:subject  <http://example.org/subject32> .

<http://example.org/subject32>
    rdf:type          ex:ExampleSubjects ;
    dcrdf:valueString "Biology"@en , "EA32"^^ex:SubjectEncoding ;

OWL ist ähnlicher Natur, aber ziemlich faszinierend, weil es seine eigene Semantik ziemlich elegant beschreiben kann. Zum Beispiel könnten Sie tatsächlich eine Regel haben "Alle Wörter, die Gegenstand eines Satzes sind, sind auch Substantive". Diese Beziehungen können so regelmäßig spezifiziert werden, dass OWL-Benutzer "Reasoners" verwenden können, um Beziehungen zu ergänzen, die nicht explizit im Dokument niedergeschrieben wurden.

Die fantastische Kraft dieser Semantic-Web-Sprachen besteht darin, dass Sie, wenn jemand die Semantik dessen, was Wort Nr. 42 in einem bestimmten Konstrukt bedeuten soll, nicht angegeben hat, oder wenn es kein Wort gibt, das Ihren Anforderungen entspricht, eine Semantik dafür erfinden können. Sie können diese Semantik dann aufschreiben (typischerweise in einer OWL-Ontologie). Andere können diese Semantik lesen und algorithmisch darauf reagieren. Ich könnte also ein neues Wort #3.14 definieren, das Sie noch nie zuvor gesehen haben, und ich kann dies so tun, dass Sie eine Chance haben, zu verstehen, was ich damit gemeint habe!

Diese semantische Fähigkeit wäre extrem wichtig, wenn Zeitverzögerungen groß wären. Sprachen entwickeln sich im Laufe der Zeit, und wenn zwischen den Kommunikationen genügend Zeit vergeht, ist es vernünftig zu glauben, dass sich die Bedeutung von Noun # 42 für eine Kultur ändern könnte und nicht für die andere. Die Fähigkeit, zumindest zu versuchen, die Semantik dessen zu erfassen, was Sie sagen, wäre sehr wichtig, um diese Effekte zu bekämpfen.

Das ist ganz in der Richtung dessen, was ich dachte. Ein wichtiges Beispiel (und was ich gut genug zum Rendern herausfinden möchte) ist eine Seite, auf der sie uns Dinge sagen, die wir bereits wissen: Eigenschaften unseres Sonnensystems, einschließlich Dinge wie Masse, Radius und Umlaufbahnparameter der Planeten. Das sind meistens Attribute von Namen
Abgesehen davon, dass Subjekte, Prädikate und Objekte Satzteile und keine Wortteile sind , das heißt, sie gehören zur Syntax und nicht zur Morphologie . Dies ist ein Kategoriefehler. Sowohl das Wort „er“ als auch das Wort „Leser“ können als Subjekte oder Objekte (syntaktische Teile oder Satz) fungieren, aber „er“ ist ein Pronomen und „Leser“ ist ein Substantiv (morphologische Wortarten). (Das Wort "Leser" kann von einem Artikel oder einem Adjektiv abgeleitet werden und bildet den Plural auf -s ; dann kann das Wort "er" nicht durch einen Artikel oder ein Adjektiv bestimmt werden und hat eine besondere Beugung.)
@AlexP In diesem Fall nehme ich an, dass die "Sprachteile" in diesen Sprachen IRI und Datentyp wären. Ich muss mir überlegen, wie ich das am besten formuliere. Ich hatte das Gefühl, ich würde den Leser bereits verlieren, wenn er versucht, tief genug in die Sprachen einzutauchen, um sie an die Frage zu binden.
Toller Punkt über die Zeitverzögerung in der Kommunikation und die Konnotationen von Wörtern, die sich ändern. Ich stelle mir Aliens aus Gliese 581 c vor, die von den Flintstones Englisch gelernt haben und uns begrüßen, indem sie uns eine "gay old time" wünschen. Ich wünschte auch, ich könnte Ihnen zusätzliche Punkte für die Boondock Saints-Referenz geben.

Sprache lässt sich in mehrere Schichten unterteilen.

  • Phonologie ist das Studium der kleinsten unteilbaren Teile, aus denen die Sprache aufgebaut ist. Dies bezieht sich auf Laute wie das /g/ oder /k/ in der gesprochenen menschlichen Sprache. Wenn Ihre Linguisten eine Funkübertragung untersucht haben, könnte es sich um ein Computerbit oder ein ähnliches Konstrukt handeln.
  • Morphologie ist das Studium der kleinsten bedeutungstragenden Sprachstücke. Morpheme sind natürlich aus einer unterschiedlichen Anzahl von Phonemen aufgebaut. Ein Beispiel für ein Morphem wäre das -ist im Morphologen, das eine Bedeutung hat, obwohl es nicht für sich alleine stehen kann. Wortarten fallen in dieses Feld.
  • Syntax ist die Untersuchung, wie Sprecher Morpheme kombinieren, um grammatikalisch korrekte Sätze zu bilden. Zum Beispiel: "Die Katze ging mit ihren Pfoten über den Berg." ist ungrammatisch, obwohl es verständlich ist.
  • Semantik ist die Lehre davon, was Sätze bedeuten. "Die Katze flog an ihren Schnurrhaaren durch den Berg." ist grammatikalisch und hat eine semantische Bedeutung. Was zufällig Unsinn ist.
  • Pragmatik ist die Lehre davon, wie sich Sprache auf die Außenwelt bezieht. Zum Beispiel: "Könnten Sie die Tür schließen?" ist semantisch eine Frage, aber pragmatisch ist es eine Bitte (auf Englisch). Ein weiteres Beispiel sind Verträge. Indem Sie Ja zu einem Geschäft sagen, sagen Sie nicht nur, dass Sie das Geschäft akzeptieren, sondern die Aussage selbst macht das Geschäft gültig.

Semantik und Pragmatik sind sehr wenig verstandene Felder.

Um eine Übertragung von einer außerirdischen Spezies zu analysieren, müsste man bestimmen, was die Phonologie ist, dann durch jede Schicht gehen und versuchen, herauszufinden, wie die Teile auf gültige und ungültige Weise kombiniert werden können.

In Bezug auf die Wortarten befürchte ich, dass sich das Klassifizierungssystem je nach Sprache unterscheidet, da wir nicht nach einem universellen System klassifizieren, wir unterscheiden Wörter in dieselben Wortarten, die die Grammatik dieser Sprache verwendet .

Lojban (da Sie gefragt haben) hat keine unterschiedlichen Verben, Substantive, Adverbien und Adjektive. Es hat Prädikate wie „prenu“ (ist eine Person) oder „xamgu“ (ist gut). Man kann „le xamgu ku“ (das Ding, das gut ist) oder „le prenu ku“ (das Ding, das eine Person ist, oder einfach nur „Person“) sagen, und in bestimmten Fällen können viele dieser Partikel weggelassen werden, z. B. „ .i prenu cu xamgu“ (die Person ist gut) statt „.i le prenu ku cu xamgu“. Dieses Phänomen (die Argumente eines Prädikats) ist etwas wie Nominalphrasen im Englischen, aber die Sprache unterscheidet absolut nicht zwischen dem, was man als Verben und Adjektive betrachten könnte, noch sollten Sie versuchen, sie so zu klassifizieren.

""Die Katze ist an ihren Schnurrhaaren durch den Berg geflogen." /.../ ist zufällig Unsinn." Wir sind auf Worldbuilding . Ich wäre mir da nicht so sicher.
Mit „absolut keine Unterscheidung zwischen dem, was man als Verben und Adjektive betrachten könnte“, kann ich nur annehmen, dass Sie die Syntax betreffen; zB „ist rot“ und „läuft“ sind beide Prädikate, die auf die gleiche Weise behandelt werden. Aber Beziehungspartner und internes Attribut sind semantisch verschiedene Dinge.

Eine "Wortart" ist nur ein Klassifikationsschema, das von Forschern der Sprache auferlegt wird, um Wortklassen zu beschreiben. Diese Gruppen basieren auf der Grammatikfunktion dieser Wörter, und hier bekommen wir „Substantiv“ und „Verb“ und „Präposition“; sie beschreiben Klassen von Wörtern im Englischen. Aber Sie haben auch Substantive, die sich wie Verben verhalten ("Google that.") und viele weitere seltsame Konstruktionen, die dazu führen, dass jede "Wortart" bis ganz nach unten in ihre eigene Wortart zerlegt wird.

Es gibt also keine Zahl für die Summe „aller Arten von Wortarten“. Englisch hat eine Art Adverb; Japanisch hat drei. Sind das getrennte Wortarten oder nicht?

Nun, wenn Sie die Symbole in Ihrer Sprache klassifizieren möchten, gibt es eine ziemlich gute Anleitung. Der Kontakt von Carl Sagan löst genau das Problem, das Sie beschreiben; Sie müssen mit den ersten Prinzipien beginnen und diese in eine komplexe Sprache einbauen. SETI hat versucht, eine solche Botschaft zu erfinden, und es ist wirklich, wirklich schwer.

Wenn Sie Bilder verschicken können, brauchen Sie nur eine „Wortart“, das DING. Mit einem THING können Sie Substantive angeben; Sobald Sie ein Substantiv (ATOM) haben, können Sie ein "Gleichheitsding" (ATOM = ATOM) erstellen und dann von dort aus fortfahren und DINGE angeben, die Zahlen sind, Dinge zählen usw.

Sie können die Syntax verwenden, um Konzepte wie die Veränderung im Laufe der Zeit zu erklären ( PROTON = PROTON, ELEKTRON GEGENÜBER PROTON, PROTON + NEUTRON = NEUTRON, PROTON UND ELEKTRON = WASSERSTOFF), aber alles ist nur eine SACHE.

Wenn das zu handgewellt klingt ( weil es so ist ), sollten Sie sich vielleicht mit der Codierungstheorie befassen. Was Sie wirklich wollen, ist ein Komprimierungsalgorithmus / Paritätsalgorithmus, der Mathematik mit generischen Symbolen erklärt.

"Ding" ist überhaupt nicht sinnvoll, da es keine Unterscheidungen gibt. Aber Ihr Beispiel hat proton(Substantiv, generisch), =(eine Beziehung angeben), +(eine Operation ausführen) ,und ( )(Struktur). Ja, das sind alles Wörter, die kodiert werden können; zu sagen, das bringt nichts.
«Nomen, die sich wie Verben verhalten» Ihr Beispiel ist ein Verb, das von einem Substantiv abstammt und als (Aktions-)Verb verwendet wird. Vielleicht wollten Sie sich Gerundien ansehen (oder was ist das Gegenteil davon)?
"Ding" war nicht das beste Wort, weil ich eigentlich eher "ein Symbol, das ein Objekt beschreibt" meine. "Google" ist ein Eigenname für eine Suchmaschine, aber es kann als Verb verwendet werden, um die Aktion einer aktuellen Websuche zu beschreiben. Meine Absicht war zu sagen, dass (1) Sie sich wirklich eine Methode ansehen möchten, um Substantive als Symbole zu codieren, nicht als „Wörter“ oder „Wortteile“, und (2) mit einem klugen Kontext und einer klugen Organisation, die Sie nur verwenden können Substantive (und Substantive als Verben) verwenden, um komplexe Ideen zu kommunizieren, und (3) "Wortarten" für Ihren Anwendungsfall bedeutungslos sind, was Sie wirklich brauchen, ist eine Methode zum Codieren von Symbolen für Objekte.