Informationsintegration ist das Verschmelzen heterogener Informationen verschiedener Quellen zu einem homogenen Gesamtbild. Diese Vorlesung ist eine Einführung in dieses hochaktuelle Thema. Neben den Grundlagen der Informationsintegration, z.B. verteilten Datenbankarchitekturen, lernen Sie Techniken der materialisierten und virtuellen Integration und deren Optimierung kennen, sowie Techniken zur Datenreinigung.
Einführung | 01:28:11 | |
---|---|---|
Integrierte Informationssysteme | 00:07:15 | |
Vorstellung der Arbeitsgruppe | 00:13:52 | |
Organisatorisches | 00:18:11 | |
Integrierte Informationssysteme | 00:13:23 | |
Beispiele für Integration | 00:19:29 | |
Ein altes Problem | 00:16:01 |
Architekturen | 01:30:43 | |
---|---|---|
Wiederholung | 00:09:39 | |
Ausblick auf das Semester | 00:19:09 | |
Architekturen | 00:15:59 | |
Verteilung | 00:13:59 | |
Heterogenität | 00:23:09 | |
Strukturelle Heterogenität | 00:08:48 |
Überblick über Informationssysteme, Architekturen & Mediator - Wrapper Architektur | 01:30:22 | |
---|---|---|
Heterogenität | 00:14:24 | |
Materialisiert vs. virtuell | 00:12:24 | |
Virtuelle Integration | 00:10:09 | |
Architekturen | 00:11:48 | |
5-Schichten Architektur | 00:14:12 | |
Mediator-Wrapper Architektur | 00:09:32 | |
Mediatoren | 00:17:53 |
Schema Mapping | 01:18:31 | |
---|---|---|
Peer-Data-Management | 00:21:01 | |
Schema Mapping | 00:15:28 | |
Schema Mapping - Definitionen | 00:13:53 | |
Schema Mapping Beispiel | 00:16:44 | |
Geschachtelt vs. Flach | 00:11:25 |
Schema Matching and Mapping Interpretation | 01:27:47 | |
---|---|---|
Klassifikation von Schema Matching Methoden | 00:20:24 | |
Label-based | 00:18:26 | |
Erweiterungen | 00:15:23 | |
Stable Marriage | 00:15:10 | |
Mapping Interpretation | 00:11:23 | |
"Erfinden" von Werten | 00:07:01 |
Mapping Interpretation & Mapping Werkzeuge | 01:25:46 | |
---|---|---|
Mapping Beispiel | 00:15:46 | |
Entdeckung von logischen Mappings | 00:08:30 | |
Erzeugung der Anfragen | 00:21:33 | |
Erzeugung der Anfragen - xQuery | 00:19:51 | |
Global as View / Local as View | 00:13:27 | |
Zusammenfassung | 00:06:39 |
Global-as-View: GaV | 01:11:43 | |
---|---|---|
Motivation | 00:04:02 | |
Korrespondenzen | 00:07:29 | |
Übersicht Anfrageplanung | 00:15:46 | |
Beispiel | 00:11:25 | |
Global as View | 00:17:30 | |
Integritätsconstraints (ICs) | 00:15:31 |
Global-as-View (2) | 00:14:42 | |
---|---|---|
Überblick | 00:05:50 | |
GaV - Schachtelung | 00:08:52 |
Local-as-View | 01:14:41 | |
---|---|---|
Überblick | 00:15:14 | |
Global ICs | 00:14:27 | |
Anwendungen | 00:12:49 | |
Anfrageplanung | 00:16:45 | |
Anfragebearbeitung | 00:15:26 |
Containment & GLaV | 01:25:56 | |
---|---|---|
Local as View - lokale ICs | 00:16:15 | |
CWA/OWA | 00:12:46 | |
Containment | 00:14:53 | |
Beweis für Query Containment | 00:17:02 | |
Erzeugung der Anfragen | 00:16:00 | |
Global-Local-as-View (GLAV) | 00:09:00 |
Der Bucket-Algorithmus | 01:11:51 | |
---|---|---|
Nutzbarkeit und Nützlichkeit von Views | 00:11:03 | |
LaV - Beispiel | 00:19:25 | |
Bucket Algorithmus am Beispiel | 00:15:00 | |
Bucket Algorithmus en detail | 00:21:22 | |
LaV - BA - Analyse | 00:05:01 |
Duplikaterkenung | 01:31:27 | |
---|---|---|
Zoom in die Informationsqualität | 00:09:18 | |
Klassifikation von Datenfehlern | 00:10:02 | |
Wie entstehen Duplikate | 00:15:45 | |
Wirkungen von Duplikaten | 00:11:15 | |
Ähnlichkeitsmaße | 00:13:12 | |
Damerau-Levenshtein distance | 00:10:13 | |
Token-based Similarity Measures | 00:04:17 | |
Soundax | 00:17:25 |
Algorithmen & Evaluierung | 01:03:28 | |
---|---|---|
Naiv & Blocking | 00:18:34 | |
Sorted-Neighborhood Methode | 00:13:14 | |
Evaluierung | 00:14:22 | |
Arithmetische Mittel vs. Harmonische Mittel | 00:10:35 | |
Datenfusion | 00:06:43 |