Stocki
Mitglied
- Registriert
- 30.08.04
- Beiträge
- 1.265
- Trophäen
- ...den Überblick verloren, was solls :-)
Hallo Leute,
heut hat sich die Frage ergeben, ob es ein Programm gibt, mit dem man fast identische Bilder auffinden kann.
Hintergrund:
Derzeit laufen in vielen Ahnenforscher-Organisationen Digitalisierungen von Sterbebildern. Diese sind oft wertvolle Quellen für die Forschung, weil sie Daten aus dem aktuellen Zeitraum bieten, die sonst aus datenschutzrechtlichen Gründen nicht zugänglich sind.
Mit Fortschreiten der Projekte, jeder darf seine Sammlung zum Scannen einreichen, ergibt sich natürlich das Problem der Dubletten. Manche Forscher haben mehrere 10.000 solcher Bilder zusammen getragen und eine manuelle Dublettensuche ist dabei sehr aufwändig, auch wenn die Dateinamen die wichtigsten Daten, Name, Vorname, Lebensdaten, Ort enthalten.
Hier wäre es möglicherweise sinnvoll, mit einem Programm die neuen Scans mit dem bestehenden Bildbestand abzugleichen. Da die Bilder in unterschiedlicher Auflösung und unterschiedlicher Komprimierung erstellt werden, teilweise auch unterschiedlichen Kontrast und Farbstich haben und ebenso teilweise nicht wirklich gerade gerichtet sind ist ein Pixel zu Pixel Vergleich wie bei kopierten Dateien nicht machbar.
Hier wäre es nötig, gleiche Bildinhalte zu finden und das möglichst genau. Am sinnvollsten wäre natürlich der bildmäßige Vergleich der Textstellen, weil dies ja pro Person absolut eindeutig ist. Schmückende Grafik-Elemente oder Fotos der Person sind da weniger sinnvoll, weil erstere von der Stange kommen und sehr oft verwendet werden und zweitere, die Fotos der Personen, nicht immer in guter Qualität dargestellt werden und zu vielen Fehl-Meldungen führen können.
Die Software müsste Motive also sehr schmalbandig vergleichen, dabei aber bei unterschiedlichen Auflösungen, Farbtönen etc sehr flexibel sein.
Kennt jemand Programme, mit denen sowas sinnvol zu machen ist? Freeware oder günstige Software wäre natürlich optimal, damit ohne großem finanziellen Aufwand dezentral z.B. bei den monatlichen Forschertreffen gearbeitet werden kann.
Viele Foto-Tools bieten Suche nach ähnlichen Bildern - aber was da als ähnlich oder gleich abgeliefert wird ist den Strom nicht wert, den der PC dazu braucht...
Dass so eine Suche sehr aufwändig ist, ist klar. Aber es spricht auch nichts dagegen, einen PC einmal mehrere Tage laufen zu lassen und sich mühsames manuelles Abgleichen zu ersparen. Die Übernahme der Personen-Daten in die Dateinamen kann wegen unterschiedlichster Darstellungen auf den Bildern und den bekannten OCR-Problemen bei buchstabengetreuer Erfassung weiterhin nur manuell erfolgen. Aber zumindest die Dubletten-Sucherei würde entfallen...
Stocki
heut hat sich die Frage ergeben, ob es ein Programm gibt, mit dem man fast identische Bilder auffinden kann.
Hintergrund:
Derzeit laufen in vielen Ahnenforscher-Organisationen Digitalisierungen von Sterbebildern. Diese sind oft wertvolle Quellen für die Forschung, weil sie Daten aus dem aktuellen Zeitraum bieten, die sonst aus datenschutzrechtlichen Gründen nicht zugänglich sind.
Mit Fortschreiten der Projekte, jeder darf seine Sammlung zum Scannen einreichen, ergibt sich natürlich das Problem der Dubletten. Manche Forscher haben mehrere 10.000 solcher Bilder zusammen getragen und eine manuelle Dublettensuche ist dabei sehr aufwändig, auch wenn die Dateinamen die wichtigsten Daten, Name, Vorname, Lebensdaten, Ort enthalten.
Hier wäre es möglicherweise sinnvoll, mit einem Programm die neuen Scans mit dem bestehenden Bildbestand abzugleichen. Da die Bilder in unterschiedlicher Auflösung und unterschiedlicher Komprimierung erstellt werden, teilweise auch unterschiedlichen Kontrast und Farbstich haben und ebenso teilweise nicht wirklich gerade gerichtet sind ist ein Pixel zu Pixel Vergleich wie bei kopierten Dateien nicht machbar.
Hier wäre es nötig, gleiche Bildinhalte zu finden und das möglichst genau. Am sinnvollsten wäre natürlich der bildmäßige Vergleich der Textstellen, weil dies ja pro Person absolut eindeutig ist. Schmückende Grafik-Elemente oder Fotos der Person sind da weniger sinnvoll, weil erstere von der Stange kommen und sehr oft verwendet werden und zweitere, die Fotos der Personen, nicht immer in guter Qualität dargestellt werden und zu vielen Fehl-Meldungen führen können.
Die Software müsste Motive also sehr schmalbandig vergleichen, dabei aber bei unterschiedlichen Auflösungen, Farbtönen etc sehr flexibel sein.
Kennt jemand Programme, mit denen sowas sinnvol zu machen ist? Freeware oder günstige Software wäre natürlich optimal, damit ohne großem finanziellen Aufwand dezentral z.B. bei den monatlichen Forschertreffen gearbeitet werden kann.
Viele Foto-Tools bieten Suche nach ähnlichen Bildern - aber was da als ähnlich oder gleich abgeliefert wird ist den Strom nicht wert, den der PC dazu braucht...
Dass so eine Suche sehr aufwändig ist, ist klar. Aber es spricht auch nichts dagegen, einen PC einmal mehrere Tage laufen zu lassen und sich mühsames manuelles Abgleichen zu ersparen. Die Übernahme der Personen-Daten in die Dateinamen kann wegen unterschiedlichster Darstellungen auf den Bildern und den bekannten OCR-Problemen bei buchstabengetreuer Erfassung weiterhin nur manuell erfolgen. Aber zumindest die Dubletten-Sucherei würde entfallen...
Stocki