Welcher Pasuk in Tanach hat die meisten Buchstaben?

Ich versuche, eine Datenbank mit jedem Pasuk in Tanach zu erstellen, ich versuche, die Größe des dafür benötigten Varchar zu bestimmen. Welcher Pasuk ist das und wie viele Buchstaben hat er?

Zählst du Leerzeichen?
@DoubleAA Ich plane, ein Tora-Code-Programm zu erstellen, also brauche ich wohl mit und ohne
Ist das Ihre Datenbank in Ksiv oder in Ktiv?
Und wenn ich fragen darf, gibt es solche Programme nicht schon? Wie würde sich deine unterscheiden? Haben Sie zB schon TORAWARE.COM gesehen?

Antworten (2)

Der Vers in Tanach mit den meisten Wörtern ist Ester 8:9 ( Quelle ) mit 43 Wörtern:

ויקראו ספרי המלך בעת ההיא בחדש השלישי הוא חדש סיון בשלושה ועשרים בו ויכתב ככל אשר צוה מרדכי אל היהודים ואל האחשדרפנים והפחות ושרי המדינות אשר מהדו ועד כוש שבע ועשרים ומאה מדינה מדינה ומדינה ככתבה ועם ועם כלשנו ואל היהודים ככתבם וכלשונם: ‏

Da diese Wörter nicht so ungewöhnlich kurz aussehen (und tatsächlich eines der längsten Wörter in Tanach האחשדרפנים enthalten) und das nächstlängste Pasuk nur 41 Wörter hat, würde ich vermuten, dass dieses Pasuk auch die meisten Buchstaben hat, was nach meiner Zählung der Fall ist ist 193 (235, wenn Sie die Leerzeichen zählen).

Dies beantwortet Ihre Frage nicht, aber in MySQL beansprucht ein Varchar keinen zusätzlichen Speicherplatz, wenn Sie ihn größer als nötig machen.

Speichern Sie in UTF-8, UTF-8-MB4 oder 8859-8? Die verschiedenen Typen nehmen unterschiedlich viel Platz ein. (3, 4 bzw. 1, vorausgesetzt, Sie verwenden MySQL).

Vielleicht möchten Sie einfach varchar(65535) ausführen und sich keine Gedanken darüber machen.

Wenn Sie jedoch mit vielen Sortiervorgängen rechnen, nehmen die größeren Varchars zusätzlichen temporären Tabellenplatz in Anspruch, was die Dinge verlangsamen kann. Wenn Sie jedoch über einen Index sortieren, ist dies kein Problem.

Hmm, ich frage mich, ob dies die falsche Stackexchange-Site ist..... :)

Wenn Ihre Datenquelle Nekudos enthält, hängt die Größe auch davon ab, ob Sie das zusammengesetzte Zeichen speichern oder nicht. Wenn sie nicht zusammengesetzt sind, müssen Sie den Platz verdoppeln, um die Nekudos zu berücksichtigen. (Obwohl zusammengesetzte Zeichen etwas bevorzugt werden, sollten Sie sie konvertieren.)

Technisch gesehen belegt ein Varchar 65535 ein Byte mehr als ein Varchar 255, aber mein Hauptanliegen ist, wenn ich es jemals sortieren muss, wird eine riesige temporäre Tabelle erstellt
Ja, das ist richtig, aber da UTF-8-Hebräisch mindestens zwei Bytes pro Zeichen benötigt (unter der Annahme, dass keine Nekudos vorhanden sind), bin ich mir ziemlich sicher, dass Sie 128 Zeichen überschreiten würden, also benötigen Sie das zusätzliche Byte sowieso. Eine temporäre Tabelle kann ein Problem sein, aber werden Sie wirklich jemals alphabetisch nach dem ersten Buchstaben eines Pasuks sortieren? Sonst wird es kein Thema sein. Für Bibelcodes braucht man eine ganz andere Datenstruktur, keine Strings.
Stimme Ariel nicht zu. Ist Ariel so sicher, dass ein Programm kein Array anstelle einer Datenbank verwenden kann, um mindestens genauso gute Arbeit zu leisten?