Titelaufnahme

Titel
ROBUS : personalisierte Suche in natürlichsprachlichen Unternehmensdaten / Matthias Reichhold
Weitere Titel
ROBUS: Personalized search in enterprise environments
VerfasserReichhold, Matthias
Begutachter / BegutachterinMayr, Heinrich C. ; Fliedl, Günther
Erschienen2014
Umfang200 S. : graph. Darst.
HochschulschriftKlagenfurt, Alpen-Adria-Univ., Diss., 2014
Anmerkung
Abweichender Titel laut Übersetzung der Verfasserin/des Verfassers
Zsfassung in engl. Sprache
SpracheDeutsch
Bibl. ReferenzOeBB
DokumenttypDissertation
Schlagwörter (DE)Unternehmenssuche / Suche / kontextsensitiv / personalisiert / Computerlinguistik / Sprachverarbeitung
Schlagwörter (EN)Enterprise Search / Information Retrieval / context sensitive / folksonomy / comoputational linguistics / natural language processing
URNurn:nbn:at:at-ubk:1-24908 Persistent Identifier (URN)
Zugriffsbeschränkung
 Das Werk ist frei verfügbar
Dateien
ROBUS [4.01 mb]
Links
Nachweis
Klassifikation
Zusammenfassung (Deutsch)

In der Arbeit "ROBUS: Personalisierte Suche in natÃrlichsprachlichen Unternehmensdaten" wird ein neuartiges Verfahren zur Optimierung von Suchaufgaben in unstrukturierten Unternehmensdaten auf Basis von automatisch generierten Rollenprofilen vorgestellt. Es wird gezeigt, wie Rollenprofile mit Hilfe eines standardisierten Thesaurus aus internetbasierten Stellenausschreibungen extrahiert werden kÃnnen. HierfÃr kommen spezielle Methoden der Computerlinguistik zum Einsatz, die es ermÃglichen, Rollenprofile in Form von gewichteten Termvektoren textuell zu beschreiben. In einem ersten Schritt wird ein Textkorpus mit mehreren Tausend englischsprachigen Stellenausschreibungen erstellt. Die dafÃr verwendeten Rohdaten werden von der Internetplattform LinkedIn bezogen. Nach einem initialen Bereinigungsschritt werden die Texte in einzelne Segmente ("Tokens") aufgeteilt. FÃr jedes Token wird anschlieÃend mit Hilfe eines Part-Of-Speech-Taggers die entsprechende Wortart bestimmt und ein Abgleich mit dem bereits erwÃ$hnten Thesaurus durchgefÃhrt. Auf Basis dieses Abgleichs und weiterer Kriterien (Position und HÃ$ufigkeit des Tokens innerhalb des Ausschreibungstextes) wird der Term entweder als nicht relevant verworfen oder dem Rollenvektor hinzugefÃgt.

DarÃber hinaus wird ein Mechanismus zur dynamischen Zuordnung von generierten Rollenprofilen zu textuellen Daten vorgestellt. Dabei ist zu beachten, dass der gewÃ$hlte Mechanismus (1) gÃ$nzlich ohne manuelles Zutun funktioniert und (2) sich Ãber die dynamische Zuordnung bestimmen lÃ$sst, wie relevant ein textuelles Dokument fÃr eine bestimmte Rolle ist. Dies erfolgt durch die Bestimmung von Ãhnlichkeiten im Vektorraum-Modell. Dabei wird fÃr jeden Rollenvektor die Kosinus-Ãhnlichkeit zu den vorhandenen Textdokumenten berechnet. Die Optimierung der Suchergebnisse erfolgt auf Basis folgender These:

Umso hÃher die Ãhnlichkeit eines Dokuments zu einem Rollenprofil i ist auch die Relevanz des jeweiligen Dokuments fÃr alle Benutzer/innen, die diesem Rollenprofil zugeordnet sind. Dementsprechend werden die Suchergebnisse anhand der Ãhnlichkeitswerte neu gereiht. Im Rahmen der Dissertation wurde das hier beschriebene Verfahren vollstÃ$ndig implementiert und ausfÃhrlich evaluiert. Auf Basis der daraus gewonnen Testergebnisse wurde bewiesen, dass ein rollensensitives Suchverfahren in Form des ROBUS Systems zu einer signifikanten Verbesserung im Bereich der Unternehmenssuche beitrÃ$gt. Zu beachten ist auÃerdem, dass dieses System nicht als vollstÃ$ndige Suchmaschine, sondern vielmehr als Erweiterung zu bestehenden Suchsystemen zu verstehen ist. Die Suchergebnisse der zugrunde liegenden Suchmaschine werden durch das System anhand der Rollenprofile neu gereiht. Zur Evaluierung des Systems wurde die frei verfÃgbare Apache Lucene Implementierung herangezogen. Diese Vorgehensweise ermÃglicht die Generierung von objektiven und vergleichbaren Testergebnissen.

Zusammenfassung (Englisch)

No abstract available

Statistik
Das PDF-Dokument wurde 15 mal heruntergeladen.