Text Mining: Wissensgewinnung aus natürlichsprachigen Dokumenten

Text Mining: Wissensgewinnung aus natürlichsprachigen Dokumenten

Submitted by witte on Tue, 2011-01-04 09:41

Title	Text Mining: Wissensgewinnung aus natürlichsprachigen Dokumenten
Publication Type	Report
Year of Publication	2006
Refereed Designation	Does Not Apply
Editors	Witte, R., and J. Mülle
Institution	Universität Karlsruhe, Fakultät für Informatik, Institut für Programmstrukturen und Datenorganisation (IPD)
Report Number	Interner Bericht 2006-5
Other Numbers	ISSN 1432-7864
Abstract	Das noch recht junge Forschungsgebiet Text Mining umfaßt eine Verbindung von Verfahren der Sprachverarbeitung mit Datenbank- und Informationssystemtechnologien. Es entstand aus der Beobachtung, dass ca. 85% aller Datenbankinhalte nur in unstrukturierter Form vorliegen, so dass sich die Techniken des klassischen Data Mining zur Wissensgewinnung nicht anwenden lassen. Beispiele für solche Daten sind Volltextdatenbanken mit Büchern, Unternehmenswebseiten, Archive mit Zeitungsartikeln oder wissenschaftlichen Publikationen, aber auch Ströme kontinuierlich auflaufender Emails oder Meldungen von Nachrichtenagenturen (Newswires). Im Gegensatz zum Information Retrieval geht es beim Text Mining nicht darum, lediglich Dokumente anhand von Anfragen aufzufinden, sondern aus einem einzelnen oder einem Satz von Dokumenten neues Wissen zu gewinnen, etwa durch automatische Textzusammenfassungen, die Erkennung und Verfolgung benannter Objekte oder die Aufdeckung neuer Trends in Forschung und Industrie. Durch die ständig wachsende Zahl elektronisch verfügbarer Texte werden automatisch arbeitende Verfahren zur Bewältigung der Informationsflut immer dringender, was Text Mining zu einem sehr aktiven und auch kommerziell interessanten Forschungsgebiet macht. Der vorliegende Bericht enthält eine Auswahl von Themen, die von Studierenden der Universität Karlsruhe im Rahmen eines Hauptseminars am IPD im Wintersemester 2004/2005 erarbeitet wurden. Sie reichen von den Grundlagen der Computerlinguistik über einzelne Algorithmen zur Sprachverarbeitung bis hin zu konkreten Anwendungen im Text Mining. Zahlreiche Literaturreferenzen zu jedem Kapitel sollen dem Leser eine weitergehende Studie der einzelnen Themen ermöglichen.
URL	http://digbib.ubka.uni-karlsruhe.de/volltexte/1000005161

Attachment	Size
TextMining-Bericht2006.pdf	2.37 MB

Login to post comments
Tagged
XML
BibTex
Google Scholar

Site Menu

User login

Upcoming events

Popular content

Today's:

All time:

Last viewed:

Current weather

Text Mining: Wissensgewinnung aus natürlichsprachigen Dokumenten

See also

Related Links

Tag Cloud

New Publications

Recent blog posts

New forum topics

Syndicate

Search

Semantic Assistants Durm Wiki Open Positions	Search this site: