Gå direkt till innehållet
Population der Daten im Schema der extrahierten Webtabelle
Spara

Population der Daten im Schema der extrahierten Webtabelle

Lägsta pris på PriceRunner
Tabellarische Daten sind eine bestehende Informationsquelle im Internet. Wir haben mit der Sammlung von HTML-Tabellen aus dem Internet begonnen. Zun chst werden Tabellen guter Qualit t identifiziert, dann wird ein Schema-Matching durchgef hrt. Beim Schema-Matching wird die Anzahl der bereinstimmungen ermittelt, die die hnlichen Elemente aus zwei verschiedenen Schemata bestimmen. Die Spalten und Datenwerte werden nacheinander verglichen, um das Schema abzugleichen. Bei der Suche nach tabellarischen Daten im Web kann die Suchmaschine eine URL anstelle von tabellarischen Daten zur ckgeben, was das Hauptproblem ist. Wir arbeiten also an diesem Problem, indem wir Daten von tabellarischen Webseiten extrahieren und ihr Schema extrahieren und dann einen Schemaabgleich durchf hren, indem wir die Korrespondenz hnlicher Elemente durch korpusbasierte Technik identifizieren. Nach dem Schemaabgleich f llten wir die Daten der HTML-Seiten auf, indem wir verwandte Tabellen in einer HTML-Tabelle zusammenf gten, die f r die Benutzer besser geeignet und hilfreich ist.
ISBN
9786207667543
Språk
Tyska
Vikt
95 gram
Utgivningsdatum
2024-06-16
Sidor
56