Skip to main content

TU MEHR: So verwenden Sie das Ngram Viewer-Tool in Google Books - 2021

What we learned from 5 million books (Kann 2021).

Anonim

Ein Ngram, allgemein auch als N-Gramm bezeichnet, ist eine statistische Analyse von zu suchendem Text oder Sprachinhalt n (eine Zahl) von einer Art Element im Text.

Der Suchbegriff könnte alle möglichen Dinge sein, wie Phoneme, Präfixe, Phrasen oder Buchstaben. Obwohl das N-Gramm außerhalb der Forschungsgemeinschaft etwas unklar ist, wird es in einer Vielzahl von Bereichen eingesetzt und hat viele Auswirkungen auf Entwickler, die Computerprogramme programmieren, die die natürliche gesprochene Sprache verstehen und darauf reagieren.

Im Fall von Google Books Ngram Viewer stammt der zu analysierende Text aus der Vielzahl von Büchern, die Google aus öffentlichen Bibliotheken eingescannt hat, um deren Google Books-Suchmaschine aufzufüllen. Beim Google Books Ngram Viewer beziehen sie sich auf den zu durchsuchenden Text als Korpus . Der Ngram Viewer fasst die Sprachen zusammen, obwohl Sie britisches und amerikanisches Englisch getrennt analysieren oder zusammenfassen können.

Wie funktioniert Ngram?

  1. Rufen Sie Google Books Ngram Viewer unter books.google.com/ngrams auf.

  2. Geben Sie einen oder mehrere Sätze ein, die Sie analysieren möchten. Trennen Sie jeden Satz mit einem Komma. Google schlägt vor: "Albert Einstein, Sherlock Holmes, Frankenstein". Im Gegensatz zu Google-Web-Suchen wird bei Artikeln die Groß- und Kleinschreibung beachtet.

  3. Geben Sie einen Datumsbereich ein. Der Standardwert ist 1800 bis 2000.

  4. Wähle einen Korpus. Sie können nach fremdsprachigen Texten oder Englisch suchen. Zusätzlich zu den Standardoptionen können Sie am unteren Rand Dinge wie "English (2009)" oder "American English (2009)" sehen. Dies sind ältere Korpora, die Google seitdem aktualisiert hat, aber Sie haben möglicherweise einen Grund, Vergleiche mit alten Datensätzen anzustellen. Die meisten Benutzer können sie ignorieren und sich auf die neuesten Korpora konzentrieren.

  5. Stellen Sie Ihre Glättungsstufe ein. Die Glättung bezieht sich darauf, wie glatt die Grafik am Ende ist. Die genaueste Darstellung wäre ein Glättungsgrad von 0, diese Einstellung kann jedoch schwierig zu lesen sein. Die Standardeinstellung ist 3. In den meisten Fällen müssen Sie sie nicht anpassen.

  6. Drücken Sie die Durchsuchen Sie viele Bücher Taste.

Google ermöglicht es Ihnen, mit dem Ngram Viewer einen gewissen Drilldown durchzuführen. Wenn Sie nach dem Verb suchen möchten, anstatt nach dem Substantiv, können Sie dies mit Hilfe von Tags tun. In diesem Fall würden Sie nach "fish_VERB" suchen.

Google bietet eine vollständige Liste der Befehle, die Sie verwenden können, sowie andere erweiterte Dokumentationen auf ihrer Website.

Was zeigt Ngram?

Google Books Ngram Viewer gibt ein Diagramm aus, das die Verwendung eines bestimmten Ausdrucks in Büchern über die Zeit darstellt. Wenn Sie mehr als ein Wort oder einen Satz eingegeben haben, werden farblich markierte Zeilen angezeigt, um die verschiedenen Suchbegriffe abzugleichen. Dies ist ziemlich ähnlich zu Google Trends, nur die Suche deckt einen längeren Zeitraum ab.

Fallstudie

Betrachten Sie die Fallstudie von Essigkuchen. Sie werden in Laura Ingalls Wilders erwähnt Kleines Haus in der Prärie Serie. Bei der Erkundung der Websuche von Google erfahren Sie mehr über Essigkuchen, die als Teil der amerikanischen Küche des Südens angesehen werden und aus Essig hergestellt werden. Sie hören auf Zeiten zurück, als nicht jeder zu jeder Jahreszeit Zugang zu frischen Produkten hatte. Aber ist das die ganze Geschichte?

Suchen Sie in Google Ngram Viewer nach Essigkuchen Sie werden einige Erwähnungen des Kuchens im frühen und späten 19. Jahrhundert, viele Erwähnungen in den 1940er Jahren und eine zunehmende Anzahl von Erwähnungen in letzter Zeit feststellen. Mit einem Glättungsgrad von 3 sehen Sie jedoch ein Plateau über den Erwähnungen im 19. Jahrhundert. Da zu dieser Zeit nicht viele Bücher veröffentlicht werden und unsere Daten als glatt eingestellt sind, verzerren sie das Bild. Wahrscheinlich gab es ein Buch, das Essigkuchen erwähnte, und es wurde gerade gemittelt, um eine Spitze zu vermeiden. Wenn Sie die Glättung auf 0 setzen, sehen Sie, dass dies genau der Fall ist. Die Spitze dreht sich um 1869, und 1897 und 1900 gibt es eine weitere Spitze.

Es ist unwahrscheinlich, dass niemand den Rest der Zeit über Essigkuchen sprach: Es gab wahrscheinlich Rezepte, die überall herumtrieben, aber die Leute taten dies einfach nicht schreiben über sie in Büchern, und das ist eine wichtige Einschränkung dieser Ngram-Suchen.