Bibliographic Metadata

Title
ROBUS : personalisierte Suche in natürlichsprachlichen Unternehmensdaten / Matthias Reichhold
Additional Titles
ROBUS: Personalized search in enterprise environments
AuthorReichhold, Matthias
CensorMayr, Heinrich C. ; Fliedl, Günther
Published2014
Description200 S. : graph. Darst.
Institutional NoteKlagenfurt, Alpen-Adria-Univ., Diss., 2014
Annotation
Abweichender Titel laut Übersetzung der Verfasserin/des Verfassers
Zsfassung in engl. Sprache
LanguageGerman
Bibl. ReferenceOeBB
Document typeDissertation (PhD)
Keywords (DE)Unternehmenssuche / Suche / kontextsensitiv / personalisiert / Computerlinguistik / Sprachverarbeitung
Keywords (EN)Enterprise Search / Information Retrieval / context sensitive / folksonomy / comoputational linguistics / natural language processing
URNurn:nbn:at:at-ubk:1-24908 Persistent Identifier (URN)
Restriction-Information
 The work is publicly available
Files
ROBUS [4.01 mb]
Links
Reference
Classification
Abstract (German)

In der Arbeit "ROBUS: Personalisierte Suche in natÃrlichsprachlichen Unternehmensdaten" wird ein neuartiges Verfahren zur Optimierung von Suchaufgaben in unstrukturierten Unternehmensdaten auf Basis von automatisch generierten Rollenprofilen vorgestellt. Es wird gezeigt, wie Rollenprofile mit Hilfe eines standardisierten Thesaurus aus internetbasierten Stellenausschreibungen extrahiert werden kÃnnen. HierfÃr kommen spezielle Methoden der Computerlinguistik zum Einsatz, die es ermÃglichen, Rollenprofile in Form von gewichteten Termvektoren textuell zu beschreiben. In einem ersten Schritt wird ein Textkorpus mit mehreren Tausend englischsprachigen Stellenausschreibungen erstellt. Die dafÃr verwendeten Rohdaten werden von der Internetplattform LinkedIn bezogen. Nach einem initialen Bereinigungsschritt werden die Texte in einzelne Segmente ("Tokens") aufgeteilt. FÃr jedes Token wird anschlieÃend mit Hilfe eines Part-Of-Speech-Taggers die entsprechende Wortart bestimmt und ein Abgleich mit dem bereits erwÃ$hnten Thesaurus durchgefÃhrt. Auf Basis dieses Abgleichs und weiterer Kriterien (Position und HÃ$ufigkeit des Tokens innerhalb des Ausschreibungstextes) wird der Term entweder als nicht relevant verworfen oder dem Rollenvektor hinzugefÃgt.

DarÃber hinaus wird ein Mechanismus zur dynamischen Zuordnung von generierten Rollenprofilen zu textuellen Daten vorgestellt. Dabei ist zu beachten, dass der gewÃ$hlte Mechanismus (1) gÃ$nzlich ohne manuelles Zutun funktioniert und (2) sich Ãber die dynamische Zuordnung bestimmen lÃ$sst, wie relevant ein textuelles Dokument fÃr eine bestimmte Rolle ist. Dies erfolgt durch die Bestimmung von Ãhnlichkeiten im Vektorraum-Modell. Dabei wird fÃr jeden Rollenvektor die Kosinus-Ãhnlichkeit zu den vorhandenen Textdokumenten berechnet. Die Optimierung der Suchergebnisse erfolgt auf Basis folgender These:

Umso hÃher die Ãhnlichkeit eines Dokuments zu einem Rollenprofil i ist auch die Relevanz des jeweiligen Dokuments fÃr alle Benutzer/innen, die diesem Rollenprofil zugeordnet sind. Dementsprechend werden die Suchergebnisse anhand der Ãhnlichkeitswerte neu gereiht. Im Rahmen der Dissertation wurde das hier beschriebene Verfahren vollstÃ$ndig implementiert und ausfÃhrlich evaluiert. Auf Basis der daraus gewonnen Testergebnisse wurde bewiesen, dass ein rollensensitives Suchverfahren in Form des ROBUS Systems zu einer signifikanten Verbesserung im Bereich der Unternehmenssuche beitrÃ$gt. Zu beachten ist auÃerdem, dass dieses System nicht als vollstÃ$ndige Suchmaschine, sondern vielmehr als Erweiterung zu bestehenden Suchsystemen zu verstehen ist. Die Suchergebnisse der zugrunde liegenden Suchmaschine werden durch das System anhand der Rollenprofile neu gereiht. Zur Evaluierung des Systems wurde die frei verfÃgbare Apache Lucene Implementierung herangezogen. Diese Vorgehensweise ermÃglicht die Generierung von objektiven und vergleichbaren Testergebnissen.

Abstract (English)

No abstract available

Stats
The PDF-Document has been downloaded 14 times.