Ich versuche, eine Datenbank mit jedem Pasuk in Tanach zu erstellen, ich versuche, die Größe des dafür benötigten Varchar zu bestimmen. Welcher Pasuk ist das und wie viele Buchstaben hat er?
Der Vers in Tanach mit den meisten Wörtern ist Ester 8:9 ( Quelle ) mit 43 Wörtern:
ויקראו ספרי המלך בעת ההיא בחדש השלישי הוא חדש סיון בשלושה ועשרים בו ויכתב ככל אשר צוה מרדכי אל היהודים ואל האחשדרפנים והפחות ושרי המדינות אשר מהדו ועד כוש שבע ועשרים ומאה מדינה מדינה ומדינה ככתבה ועם ועם כלשנו ואל היהודים ככתבם וכלשונם:
Da diese Wörter nicht so ungewöhnlich kurz aussehen (und tatsächlich eines der längsten Wörter in Tanach האחשדרפנים enthalten) und das nächstlängste Pasuk nur 41 Wörter hat, würde ich vermuten, dass dieses Pasuk auch die meisten Buchstaben hat, was nach meiner Zählung der Fall ist ist 193 (235, wenn Sie die Leerzeichen zählen).
Dies beantwortet Ihre Frage nicht, aber in MySQL beansprucht ein Varchar keinen zusätzlichen Speicherplatz, wenn Sie ihn größer als nötig machen.
Speichern Sie in UTF-8, UTF-8-MB4 oder 8859-8? Die verschiedenen Typen nehmen unterschiedlich viel Platz ein. (3, 4 bzw. 1, vorausgesetzt, Sie verwenden MySQL).
Vielleicht möchten Sie einfach varchar(65535) ausführen und sich keine Gedanken darüber machen.
Wenn Sie jedoch mit vielen Sortiervorgängen rechnen, nehmen die größeren Varchars zusätzlichen temporären Tabellenplatz in Anspruch, was die Dinge verlangsamen kann. Wenn Sie jedoch über einen Index sortieren, ist dies kein Problem.
Hmm, ich frage mich, ob dies die falsche Stackexchange-Site ist..... :)
Wenn Ihre Datenquelle Nekudos enthält, hängt die Größe auch davon ab, ob Sie das zusammengesetzte Zeichen speichern oder nicht. Wenn sie nicht zusammengesetzt sind, müssen Sie den Platz verdoppeln, um die Nekudos zu berücksichtigen. (Obwohl zusammengesetzte Zeichen etwas bevorzugt werden, sollten Sie sie konvertieren.)
Doppelte AA
qwertymk
rüpelhaft
rüpelhaft