OpenSource BigData-Analytics-Programm?

Du suchst ein Programm für einen bestimmten Zweck?
Antworten
ricksanchez
Beiträge: 45
Registriert: 06.03.2017 14:51:18

OpenSource BigData-Analytics-Programm?

Beitrag von ricksanchez » 21.07.2017 13:26:22

Hi,

gibt es ein Programm mit dem man in Form von BigData-Analytics diverse PDF-Dateien auswerten kann? Zum Beispiel um verschiedene Merkmale zu vergleichen? Z.B. Autoren, Themenschwerpunkte usw.

GIbt es sowas überhaupt?

Danke schonmal :hail:

heikoindibit
Beiträge: 3
Registriert: 12.09.2017 10:51:07
Kontaktdaten:

Re: OpenSource BigData-Analytics-Programm?

Beitrag von heikoindibit » 13.09.2017 11:58:51

Interessante Frage - hat ja per se erstmal mit Big Data nichts zu tun, eher mit Text Mining. Wenn deine PDF's wohlstrukturiert sind, gibt es da verschiedene Produkte. Sind vom Format her die PDF's identisch?

Benutzeravatar
Lord_Carlos
Beiträge: 3669
Registriert: 30.04.2006 17:58:52
Lizenz eigener Beiträge: GNU Free Documentation License
Wohnort: Dänemark

Re: OpenSource BigData-Analytics-Programm?

Beitrag von Lord_Carlos » 13.09.2017 12:44:06

Kann sein das ich da gerade ein paar Buzzwoerter durcheinander bringe, aber kann TensorFlow das vielleicht? https://www.tensorflow.org/

Code: Alles auswählen

╔═╗┬ ┬┌─┐┌┬┐┌─┐┌┬┐╔╦╗
╚═╗└┬┘└─┐ │ ├┤ │││ ║║
╚═╝ ┴ └─┘ ┴ └─┘┴ ┴═╩╝ rockt das Forum!

cronoik
Beiträge: 1561
Registriert: 18.03.2012 21:13:42
Lizenz eigener Beiträge: GNU Free Documentation License

Re: OpenSource BigData-Analytics-Programm?

Beitrag von cronoik » 13.09.2017 13:25:46

Ein Zusammenklickloesung findest du in KNIME [1]. In diesem findest du einen PDF-Node zum Lesen von PDF-Files.
Lord_Carlos hat geschrieben: ↑ zum Beitrag ↑
13.09.2017 12:44:06
Kann sein das ich da gerade ein paar Buzzwoerter durcheinander bringe, aber kann TensorFlow das vielleicht? https://www.tensorflow.org/
Kommt halt darauf an was er genau machen moechte. Momentan klingt es mir aber eher nach etwas, was er auch mit einer Tabellenkalkulation und einem pdf-parser machen koennte. Mit Tensorflow kann er natuerlich mehr machen, muss allerdings "programmieren".

[1] https://www.knime.com/knime-analytics-platform
Hilf mit unser Wiki zu verbessern!

heikoindibit
Beiträge: 3
Registriert: 12.09.2017 10:51:07
Kontaktdaten:

Re: OpenSource BigData-Analytics-Programm?

Beitrag von heikoindibit » 13.09.2017 14:10:21

naja, tensorflow ist ja eher eine machine lerning Lösung für universelle Aufgaben für die z.B. Bildanalyse .. KFZ-Nummernschilderkennung auf Bildern oder was auch immer.. Sein Frage ja nicht so generischer Natur, um zu den Text an sich zu erkennen sondern eher die semantische Analyse..

Dass Knime einen PDF-Reader hat, war mir noch gar nicht bewusst - sehr gut, vielen dank für den Hinweis! Das sollte ich mir unbedingt mal ansehen

cronoik
Beiträge: 1561
Registriert: 18.03.2012 21:13:42
Lizenz eigener Beiträge: GNU Free Documentation License

Re: OpenSource BigData-Analytics-Programm?

Beitrag von cronoik » 13.09.2017 14:17:34

Hier gibt es noch ein, von mir nicht getestetes, Beispiel zum Downloaden[1].

[1] https://www.knime.com/forum/knime-users ... mment-6046
Hilf mit unser Wiki zu verbessern!

Antworten