Sie wollen sofort loslegen?
TXTWerk ist eine leichtgewichtige Textanalyse-Framework und ermöglicht es, durch einfache Integration in Ihren Workflow aus deutschen oder englischen Texten Metadaten zu extrahieren und so zu unstrukturierten Texten semantischen Kontext zu liefern. Durch die Anwendung komplexer linguistischer und statistischer Algorithmen kann TXTWerk Ihren Text lesen und verstehen, und das mit hoher Geschwindigkeit. Ob Sie 1000 oder 10 Milliarden Dokumente verarbeiten wollen, TXTWerk erkennt die wichtigsten Schlüsselwörter, Personen, Orte, Organisationen, Events und andere Konzepte und verlinkt erwähnte Entitäten und Konzepte zu einer einer der bekanntesten Wissensquellen: Wikidata. Diese Verknüpfung und die Verwendung von Linked Open Data eröffnet völlig neue Möglichkeiten. zur weiteren Verarbeitung. TXTWerk findet nicht nur bekannte Personen, sondern ist auch in der Lage, völlig unbekannte Entitäten in Texten zu erkennen oder kundenspezifische Wissensquellen zur Anpassung von TXTWerk an eine bestimmte Domäne zu nutzen.
TXTWerk Funktionen
Entitätenerkennung und -verlinkung
TXTWerk kann Entitäten (Personen, Orte, Organisationen, Jobtitle und Events) aus Ihren Texten extrahieren und die Fundstellen im Dokument ausweisen. Die erkannten Entitäten werden zur Linked Open Data Quelle Wikidata verlinkt. Aus Buchstaben werden so Bedeutungen. Unterstützte Sprachen: Deutsch und Englisch
Erkennung unbekannter Entitäten
Auch in Wikidata nicht vorhandene Entitäten werden durch TXTWerk erkannt. Man kann das auch das Lieschen-Müller- oder Otto-Normalbürger-Problem nennen. Sie sind damit völlig unabhängig von einem zu pflegenden Lexikon. Unterstützte Sprachen: Deutsch und Englisch
Konzept-Tagging
TXTWerk findet generelle Konzepte aus der realen oder abstrakten Welt und verlinkt sie zu Wikidata. Konzepte sind Begriffe wie "Waldsterben". In Wikidata wird dies mit der URI bezeichnet. Die TXTWerk API ist aber auch in der Lage, alternative Schreibweisen für dieses Konzept auf die gleiche URI zu verlinken, beispielweise "Baumsterben". Damit ist sichergestellt, dass - egal wie man ein Konzept beschreibt - immer die gleiche Bedeutung verlinkt wird. Unterstützte Sprachen: Deutsch und Englisch
Schlüsselwort-Extraktion
TXTWerk extrahiert die wichtigsten Schlüsselwörter (tags) aus Texten. Wir benutzen hierzu statistische Algorithmen und Techniken der natürlichen Sprachverarbeitung (NLP), um Ihre Daten zu analysieren. Damit ist es möglich, die extrahierten Schlüsselwörter zu benutzen, um sie in einem Index weiterzubenutzen, Tag Clouds zu erstellen oder weitere Dimensionsreduktionen für Ihre Texte zu ermöglichen. Unterstützte Sprachen: Deutsch
Kategorie-Klassifikation
TXTWerk klassifiziert automatisch Ihren Content in verschiedene Kategorien (Ressorts). Wir benutzen hierbei Techniken des maschinellen Lernens. Für Sie entfällt die manuelle Klassifikation. Unterstützte Sprachen: Deutsch
Datumserkennung
Sind in Ihrem Text Zeitbezüge, so erkennt TXTWerk sie und gibt den absoluten Zeitpunkt an. Dabei ist es egal, ob es sich um ein explizites Datum handelt, oder um relative Zeitangaben wie "gestern", "letzte Woche" oder "vor vier Jahren". Unterstützte Sprachen: Deutsch
Preise
Evaluation (Kostenlos)
Entitätserkennung mit Wikidata URIs |
Konzept-Tagging mit Wikidata URIs |
Schlüsselwortextraktion |
Klassifikation |
Datumserkennung |
bis zu 10.000 Zeichen pro Dokument |
max. 500 Calls / Tag |
10.000 API Calls / Monat |
einen Monat kostenlos |
Enterprise
Entitätserkennung mit Wikidata URIs |
Konzept-Tagging mit Wikidata URIs |
Schlüsselwortextraktion |
Klassifikation |
Datumserkennung |
bis zu 200.000 Zeichen pro Dokument |
flexibel |
flexibel |
monatliches Abonnement |
Kontaktieren Sie uns
Sie möchten weitere Informationen erhalten? Sie haben weitere Fragen? Nehmen Sie mit uns Kontakt auf!
Über uns
TXTWerk ist die Textmining API der Neofonie GmbH, ein in Berlin ansässiger Fullservice Provider, spezialisiert auf Portale, Suche, Sozial Media, E-Publishing und Entwicklung mobiler Applikationen.
Impressum
Neofonie GmbH
Robert-Koch-Platz 4
10115 Berlin, Germany
Phone: +49 30 24627-0
Website: https://www.neofonie.de
Amtsgericht Berlin-Charlottenburg
HRB 67 460 - Sitz Berlin
Geschäftsführung:
Thomas Kitlitschko
USt-ID: DE 194 693 995
Sie benötigen Hilfe?
Sie können weitere Informationen in der Dokumentation der TXTWerk API erhalten.