Kurs:Maschinelles Lernen/Daten laden und speichern
Einführung
BearbeitenDas Laden von Daten aus CSV-Dateien ist ein zentraler Schritt, um Trainingsdaten für das maschinelle Lernen in den nachfolgenden Softwarepaketen verfügbar zu machen. Um mit den Daten zu arbeiten, muss man ferner auch wissen, wie man auf einzelne Werte oder Datensätze zugreifen kann. In dieser Lerneinheit wird das Laden und Speichern an OpenSource-Beispielen betrachtet (siehe Open Community Approach) einige Beispiele für den Zugriff auf einzelne Werte in den Daten für jede Sprache:
Zentrale Schritte
Bearbeiten- Laden einer CSV-Datei,
- Zugriff auf Zeilen, Spalten und einzelne Zellen,
- Speichern einer CSV-Datei
Zugriff auf einzelne Werte
BearbeitenUm auf einzelne Werte in den Daten zuzugreifen, können Sie die folgenden Funktionen verwenden:
- GNU R:
data$Spalte[Zeile]
- Octave:
data(Zeile, Spalte)
- Maxima:
data[Zeile, Spalte]
- Python:
data.iloc[Zeile, Spalte]
oderdata.loc[Zeile, Spalte]
Zugriff auf Spalten und Zeilen
BearbeitenUm auf Spalten und Zeilen zuzugreifen, können Sie die folgenden Funktionen verwenden:
- GNU R:
data[, Spalte]
oderdata[Zeile, ]
- Octave:
data(:, Spalte)
oderdata(Zeile, :)
- Maxima:
data[, Spalte]
oderdata[Zeile, :]
- Python:
data[Spalte]
oderdata.loc[Zeile]
Beispiele - Zugriff auf einzelne Werte
BearbeitenHier sind einige Beispiele für den Zugriff auf einzelne Werte in den Daten für jede Sprache:
GNU R
Bearbeiten# Laden von Daten aus einer CSV-Datei
data <- read.csv("daten.csv")
# Zugriff auf einzelne Werte
print(data$Spalte[1]) # Zugriff auf den ersten Wert in der Spalte
print(data$Spalte[2]) # Zugriff auf den zweiten Wert in der Spalte
Octave
Bearbeiten# Laden von Daten aus einer CSV-Datei
data = csvread("daten.csv");
# Zugriff auf einzelne Werte
disp(data(1, 1)) # Zugriff auf den ersten Wert in der ersten Zeile
disp(data(2, 2)) # Zugriff auf den zweiten Wert in der zweiten Zeile
Python
BearbeitenIn dem folgenden Beispielcode wird mit der Bibliothek pandas
gearbeitet, die zu Beginn des Codebeispiels importiert wird.
import pandas as pd
# Laden von Daten aus einer CSV-Datei
data = pd.read_csv("daten.csv")
# Zugriff auf einzelne Werte
print(data.iloc[0, 0]) # Zugriff auf den ersten Wert in der ersten Zeile
print(data.iloc[1, 1]) # Zugriff auf den zweiten Wert in der zweiten Zeile
Beispiele - Zeilen- und Spaltenzugriff
BearbeitenHier sind einige Beispiele für den Zugriff auf Spalten und Zeilen für jede Sprache:
GNU R
Bearbeiten# Laden von Daten aus einer CSV-Datei
data <- read.csv("daten.csv")
# Zugriff auf eine Spalte
print(data[, 1]) # Zugriff auf die erste Spalte
# Zugriff auf eine Zeile
print(data[1, ]) # Zugriff auf die erste Zeile
Octave
Bearbeiten# Laden von Daten aus einer CSV-Datei
data = csvread("daten.csv");
# Zugriff auf eine Spalte
disp(data(:, 1)) # Zugriff auf die erste Spalte
# Zugriff auf eine Zeile
disp(data(1, :)) # Zugriff auf die erste Zeile
Python (mit pandas)
Bearbeitenimport pandas as pd
# Laden von Daten aus einer CSV-Datei
data = pd.read_csv("daten.csv")
# Zugriff auf eine Spalte
print(data[0]) # Zugriff auf die erste Spalte
# Zugriff auf eine Zeile
print(data.loc[0]) # Zugriff auf die erste Zeile
Siehe auch
Bearbeiten- Laden und Speichern aus dem Kurs zu KnitR