Kurs:Maschinelles Lernen/Daten laden und speichern

Einführung

Bearbeiten

Das Laden von Daten aus CSV-Dateien ist ein zentraler Schritt, um Trainingsdaten für das maschinelle Lernen in den nachfolgenden Softwarepaketen verfügbar zu machen. Um mit den Daten zu arbeiten, muss man ferner auch wissen, wie man auf einzelne Werte oder Datensätze zugreifen kann. In dieser Lerneinheit wird das Laden und Speichern an OpenSource-Beispielen betrachtet (siehe Open Community Approach) einige Beispiele für den Zugriff auf einzelne Werte in den Daten für jede Sprache:

Zentrale Schritte

Bearbeiten

Zugriff auf einzelne Werte

Bearbeiten

Um auf einzelne Werte in den Daten zuzugreifen, können Sie die folgenden Funktionen verwenden:

  • GNU R: data$Spalte[Zeile]
  • Octave: data(Zeile, Spalte)
  • Maxima: data[Zeile, Spalte]
  • Python: data.iloc[Zeile, Spalte] oder data.loc[Zeile, Spalte]

Zugriff auf Spalten und Zeilen

Bearbeiten

Um auf Spalten und Zeilen zuzugreifen, können Sie die folgenden Funktionen verwenden:

  • GNU R: data[, Spalte] oder data[Zeile, ]
  • Octave: data(:, Spalte) oder data(Zeile, :)
  • Maxima: data[, Spalte] oder data[Zeile, :]
  • Python: data[Spalte] oder data.loc[Zeile]

Beispiele - Zugriff auf einzelne Werte

Bearbeiten

Hier sind einige Beispiele für den Zugriff auf einzelne Werte in den Daten für jede Sprache:

# Laden von Daten aus einer CSV-Datei
data <- read.csv("daten.csv")

# Zugriff auf einzelne Werte
print(data$Spalte[1])  # Zugriff auf den ersten Wert in der Spalte
print(data$Spalte[2])  # Zugriff auf den zweiten Wert in der Spalte
# Laden von Daten aus einer CSV-Datei
data = csvread("daten.csv");

# Zugriff auf einzelne Werte
disp(data(1, 1))  # Zugriff auf den ersten Wert in der ersten Zeile
disp(data(2, 2))  # Zugriff auf den zweiten Wert in der zweiten Zeile

In dem folgenden Beispielcode wird mit der Bibliothek pandas gearbeitet, die zu Beginn des Codebeispiels importiert wird.

import pandas as pd

# Laden von Daten aus einer CSV-Datei
data = pd.read_csv("daten.csv")

# Zugriff auf einzelne Werte
print(data.iloc[0, 0])  # Zugriff auf den ersten Wert in der ersten Zeile
print(data.iloc[1, 1])  # Zugriff auf den zweiten Wert in der zweiten Zeile

Beispiele - Zeilen- und Spaltenzugriff

Bearbeiten

Hier sind einige Beispiele für den Zugriff auf Spalten und Zeilen für jede Sprache:

# Laden von Daten aus einer CSV-Datei
data <- read.csv("daten.csv")

# Zugriff auf eine Spalte
print(data[, 1])  # Zugriff auf die erste Spalte

# Zugriff auf eine Zeile
print(data[1, ])  # Zugriff auf die erste Zeile
# Laden von Daten aus einer CSV-Datei
data = csvread("daten.csv");

# Zugriff auf eine Spalte
disp(data(:, 1))  # Zugriff auf die erste Spalte

# Zugriff auf eine Zeile
disp(data(1, :))  # Zugriff auf die erste Zeile

Python (mit pandas)

Bearbeiten
import pandas as pd

# Laden von Daten aus einer CSV-Datei
data = pd.read_csv("daten.csv")

# Zugriff auf eine Spalte
print(data[0])  # Zugriff auf die erste Spalte

# Zugriff auf eine Zeile
print(data.loc[0])  # Zugriff auf die erste Zeile


Siehe auch

Bearbeiten