[Gelöst] SQL zur Daten-Analyse?

Vom einfachen Programm zum fertigen Debian-Paket, Fragen rund um Programmiersprachen, Scripting und Lizenzierung.
Antworten
buhtz
Beiträge: 1105
Registriert: 04.12.2015 17:54:49
Kontaktdaten:

[Gelöst] SQL zur Daten-Analyse?

Beitrag von buhtz » 08.10.2021 16:55:43

Mein SQL-Wissen ist auf Schulniveau und auch noch veraltet (Ende der 90er).

Nun bin ich über eine Schulung gestolpert, die SQL im Kontext von Daten-Analyse erwähnt. So richtig erklärt wird es nicht.
Natürlich kann ich bei Daten-Analysen die Daten in einer Datenbank vorhalten, anstatt in Form von CSV Dateien oder ähnlichem. Aber hat SQL, über die Datenhaltung hinaus, noch eine zusätzliche Relevanz für Daten-Analysen?

Hat sich der Standard seit damals, ohne das ich es bemerkt habe, doch weiterentwickelt?

Was könnte dahinter stecken?
Zuletzt geändert von buhtz am 12.10.2021 11:06:06, insgesamt 1-mal geändert.
Debian 11 & 12; Desktop-PC, Headless-NAS, Raspberry Pi 4
Teil des Upstream Betreuer Teams von Back In Time (Debianbackintime)

Benutzeravatar
paedubucher
Beiträge: 855
Registriert: 22.02.2009 16:19:02
Lizenz eigener Beiträge: GNU Free Documentation License
Wohnort: Schweiz
Kontaktdaten:

Re: SQL zur Daten-Analyse?

Beitrag von paedubucher » 08.10.2021 17:04:40

Um Daten analysieren zu können muss man sie zunächst in die richtige Form bringen. Wenn du eine normalisierte relationale Datenbank hast, kannst du mit SQL schon einmal die Daten in die passende Form bringen. Was den Analyseschritt betrifft, bietet SQL (je nach Datenbank) hilfreiche Funktionen, angefangen beim Durchschnitt (mean, median), kann man etwa bei PostgreSQL auch Perzentile usw. berechnen.

Für weitere Schritte nimmt man dann in der Regel die mit SQL aufbereiteten Daten und speichert sie in ein Austauschformat ab; CSV ist da recht beliebt. Sowas liest man dann etwa mit Pandas ein und verarbeitet es mit Python weiter. R ist eine andere Alternative für diesen Schritt, genau wie Julia.
Habe nun, ach! Java
Python und C-Sharp,
Und leider auch Visual Basic!
Durchaus programmiert mit heissem Bemühn.
Da steh' ich nun, ich armer Tor!
Und bin so klug als wie zuvor.

curt123
Beiträge: 704
Registriert: 19.10.2018 12:49:35
Wohnort: NRW

Re: SQL zur Daten-Analyse?

Beitrag von curt123 » 10.10.2021 21:12:07

buhtz hat geschrieben: ↑ zum Beitrag ↑
08.10.2021 16:55:43
Aber hat SQL, über die Datenhaltung hinaus, noch eine zusätzliche Relevanz für Daten-Analysen?
SQL ist meist auch für komplexere Abfragen recht leistungsfähig und relativ schnell.

uname
Beiträge: 12072
Registriert: 03.06.2008 09:33:02

Re: SQL zur Daten-Analyse?

Beitrag von uname » 11.10.2021 12:34:40

Ich mache diese Form von Analysen nicht. Aber bei größeren Datenmengen würde ich wohl die Aktionen im RAM durchführen wollen. Leider weiß ich nicht, ob für sowas Memory-Datenbanken wie Debianredis geeignet sind. Wikipedia Redis

Benutzeravatar
TRex
Moderator
Beiträge: 8069
Registriert: 23.11.2006 12:23:54
Lizenz eigener Beiträge: MIT Lizenz
Wohnort: KA

Re: SQL zur Daten-Analyse?

Beitrag von TRex » 11.10.2021 13:53:34

buhtz hat geschrieben: ↑ zum Beitrag ↑
08.10.2021 16:55:43
Aber hat SQL, über die Datenhaltung hinaus, noch eine zusätzliche Relevanz für Daten-Analysen?
Ja.

Apache Spark würde ich noch in den Ring werfen wollen.
Jesus saves. Buddha does incremental backups.
Windows ist doof, Linux funktioniert nichtDon't break debian!Wie man widerspricht

Antworten