Hier werden Tokens nach Häufigkeit sortiert dargestellt (Zipf Ranking). Häufige Worte sind idR kurz und allgemein, seltene Worte länger und spezieller. Circa die Hälfte der Tokens in einem Korpus kommt nur einmal vor und können daher für viele statistische Analysen ignoriert werden.
Ein Klick auf ein Token fügt dieses in die Ansicht weiter unten ein.

Minimum Tokenhäufigkeit
Pro Jahr von bis


Hier werden Worthäufigkeiten nach Jahren dargestellt. Einzeltokens können per Autovervollständigung oder Klick auf die Zipfverteilung gewählt werden. Statt einzelnen Tokens kann kommasepariert eine Tokenliste oder ein Regex übergeben werden. Es kann zwischen absoluten und relativen Worthäufigkeiten gewechselt werden. Relativ bezieht sich hier auf die Summe der Vorkommen des individuellen Tokens. Für Einzeltokens kann eine lineare Regression der Worthäufigkeiten statt einem Scatterplot angezeigt werden.

Suchbegriff
Sende an
Regex
Bspw w(o|a)n(a|i)
Tokenliste
Bspw druge,woni





Verwendungszeitraum von Wortformen sortiert nach Häufigkeitsrang. Per Linksklick öffnet sich ein Popup-Fenster mit der kommaseparierten Wortliste. Ein Pfeil markiert die früheste (kaḿeńzu⇒) oder späteste (⇒ṅemėrniki) Verwendung des Wortes. Kein Pfeil bedeutet, dass die Verwendung im selben Jahr startete und endete.

Minimum Tokenhäufigkeit
Anzahl