breiteres Spektrum an relevanten Schlüsselbegriffen zu generieren. Damit können das Themenfeld und die gesamte zugehörige Wertschöpfungskette abgedeckt werden. Ein Beispiel: Für den Megatrend Intelligente Städte könnte ein Startwort lauten: Intelligente Infrastruktur. Mit diesem Startwort werden anschließend verschiedene Programme „gefüttert“.
► Application Programming Interface (API) ist eine Anwendungsprogrammierschnittstelle, die in der Lage ist, das Internet auf relevante Wikipedia-Seiten hin zu durchsuchen (auch Open-Source-Suche genannt).
►Term Frequency-Inverse Document Frequency (TF-IDF) misst die Bedeutung eines Wortes in einem Dokument innerhalb einer Sammlung von Dokumenten (Wort-Filterung).
► Word Embedding, eine Natural-Language-Processing- (NLP-)Technik, die Schlüsselwörter ermittelt, die mit dem Ausgangswort in Zusammenhang stehen.
Als Ergebnis lassen sich aus dem Startwort Intelligente Infrastruktur unter anderem folgende Schlüsselbegriffe ableiten: Intelligente Stadt, Rolltreppe, Schnellbahn, Aufzüge, Stadtentwicklung – wobei es sich hier lediglich um einen Auszug handelt, denn das tatsächliche Ergebnis der verschiedenen Programmierungsschritte würde an dieser Stelle den Rahmen sprengen. Die Generierung der genannten Schlüsselbegriffe bildet die Basis für den:
Aufbau eines Auswahlpools
Im Rahmen einer Big-Data-Analyse (Big Data beschreibt die immer rasanter wachsenden verfügbaren Datenmengen) auf der Grundlage öffentlich zugänglicher Dokumente, wie zum Beispiel bei Behörden eingereichte und einsehbare Dokumente von Unternehmen, im Internet veröffentlichte Geschäftsberichte sowie Jahres- und Halbjahresberichte, durchleuchtet MSCI alle Unternehmen anhand der ermittelten Schlüsselbegriffe (Screening). Das Ergebnis ist ein Auswahlpool an Unternehmen, die die ersten Voraussetzungen erfüllen, um in einen Themenindex aufgenommen zu werden. Unterschieden wird dabei zwischen direkter und indirekter Trefferquote. Bei der direkten Trefferquote gibt es mindestens eine Übereinstimmung des Schlüsselbegriffs im unmittelbaren Geschäftsfeld des Unternehmens. Bei der indirekten Trefferquote muss es mindestens zwei Übereinstimmungen bei den Schlüsselbegriffen in den zusammenfassenden Beschreibungen eines Unternehmens geben. Nach der Zusammenstellung des Auswahlpools durch Prüfung auf Schlüsselwörter folgt mit der Relevanzprüfung (2. Schritt) ein weiterer Qualitätssicherungsschritt, um zu gewährleisten, dass nur die Unternehmen, auf die es tatsächlich ankommt, in den Indexaufgenommen werden.