User Tools

Site Tools


r:de:first-steps

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revisionPrevious revision
Next revision
Previous revision
r:de:first-steps [2024/06/20 17:49] astefanowitschr:de:first-steps [2024/06/22 17:24] (current) – [Data Frames (Tabellen)] astefanowitsch
Line 2: Line 2:
  
 ====== Übungseinheit 1: Erste Schritte ====== ====== Übungseinheit 1: Erste Schritte ======
- 
-===== Was ist R? ===== 
- 
-R ist 
-  * eine auf statistische Verfahren spezialisierte erweiterbare Programmiersprache aber auch 
-  * eine interaktive, befehlszeilen-gesteuerte Umgebung (ähnlich wie ein Terminal), in der Sie Funktionen dieser Sprache für statistische Analysen verwenden können, ohne selbst zu programmieren. 
  
  
Line 308: Line 302:
 === Einlesen extern erzeugter Tabellen === === Einlesen extern erzeugter Tabellen ===
  
-Um eine solche Tabelle in R einzulesen, gibt es verschiedene Möglichkeiten. Die beste ist die, die Tabelle zunächst als csv-Datei abzuspeichern, wobei _csv_ für "comma-separated values" steht.+Um eine solche Tabelle in R einzulesen, gibt es verschiedene Möglichkeiten. Die beste ist die, die Tabelle zunächst als csv-Datei abzuspeichern, wobei //csv// für "comma-separated values" steht.
  
 In einer solchen Datei entspricht jede Zeile einer Zeile der Tabelle, die Spalten der Tabelle sind durch Kommas (oder manchmal auch Semikolons oder Tabulatoren) getrennt. Text sollte (wie bei R) in geraden Anführungszeichen stehen (normalerweise werden doppelte Anführungszeichen verwendet, aber einfache gehen auch). Innerhalb solcher Anführungszeichen dürfen Kommas, Tabulatoren oder Semikolons vorkommen, ohne, dass sie als Spaltengrenze interpretiert werden. In einer solchen Datei entspricht jede Zeile einer Zeile der Tabelle, die Spalten der Tabelle sind durch Kommas (oder manchmal auch Semikolons oder Tabulatoren) getrennt. Text sollte (wie bei R) in geraden Anführungszeichen stehen (normalerweise werden doppelte Anführungszeichen verwendet, aber einfache gehen auch). Innerhalb solcher Anführungszeichen dürfen Kommas, Tabulatoren oder Semikolons vorkommen, ohne, dass sie als Spaltengrenze interpretiert werden.
Line 321: Line 315:
 </code> </code>
  
-Unter https://userpage.fu-berlin.de/~anatolstef/R/wc-novels.csv finden Sie eine Liste der 100 beliebtesten Romane in diesem Format (für die Richtigkeit der Informationen kann ich nicht haften, ich habe die Tabelle aus dem Blog "Word Counter" übernommen, die Länge von Jane Austens Pride and Prejudice stimmt z.B. nicht mit der von uns oben errechneten überein, bei einigen Büchern ist es äußerst zweifelhaft, dass sie zu den 100 beliebtesten gehören, und einige sind auch keine Romane, ...). Es geht uns aber nicht um den Inhalt der Tabelle, wir wollen ja nur lernen, mit solchen Daten zu Arbeiten.+Unter https://userpage.fu-berlin.de/~structeng/data/wc-novels.csv finden Sie eine Liste der 100 beliebtesten Romane in diesem Format (für die Richtigkeit der Informationen kann ich nicht haften, ich habe die Tabelle aus dem Blog "Word Counter" übernommen, die Länge von Jane Austens Pride and Prejudice stimmt z.B. nicht mit der von uns oben errechneten überein, bei einigen Büchern ist es äußerst zweifelhaft, dass sie zu den 100 beliebtesten gehören, und einige sind auch keine Romane, ...). Es geht uns aber nicht um den Inhalt der Tabelle, wir wollen ja nur lernen, mit solchen Daten zu Arbeiten.
  
 Speichern Sie diese Tabelle auf Ihrem Computer an einer Stelle, an der Sie sie leicht wiederfinden, ich speichere sie bei mir z.B. auf dem Desktop. Speichern Sie diese Tabelle auf Ihrem Computer an einer Stelle, an der Sie sie leicht wiederfinden, ich speichere sie bei mir z.B. auf dem Desktop.
  
-Um solche csv-Dateien in R einzulesen, verwenden Sie den Befehl ''read.table()''. Dieser benötigt einen Dateipfad zu der Datei, die Sie einlesen möchten, sowie drei weitere Informationen: 1) enthält die Tabelle eine Kopfzeile, in der die Spaltennamen stehen? 2) Welches Zeichen wird verwendet, um die Spalten voneinander zu trennen? 3) Welches Zeichen wird verwendet, um Text zu kennzeichnen?+Um solche csv-Dateien in R einzulesen, verwenden Sie den Befehl ''read.table()''. Dieser benötigt einen Dateipfad zu der Datei, die Sie einlesen möchten, sowie drei weitere Informationen:  
 + 
 +  - enthält die Tabelle eine Kopfzeile, in der die Spaltennamen stehen?  
 +  - Welches Zeichen wird verwendet, um die Spalten voneinander zu trennen? 
 +  - Welches Zeichen wird verwendet, um Text zu kennzeichnen? 
 + 
 +In unserer Tabelle sind die Antworten: 
  
-In unserer Tabelle sind die Antworten: 1) Ja, die Tabelle enthält eine Kopfzeile, 2) es wird das Komma verwendet, um Spalten zu trennen, und 3) Text wird durch doppelte Anführungszeichen gekennzeichnet.+  - Ja, die Tabelle enthält eine Kopfzeile, 
 +  - es wird das Komma verwendet, um Spalten zu trennen, und 
 +  - Text wird durch doppelte Anführungszeichen gekennzeichnet.
  
 Wir können die Tabelle also wie folgt einlesen: Wir können die Tabelle also wie folgt einlesen:
Line 346: Line 348:
  
 <code> <code>
-read.table(file="https://userpage.fu-berlin.de/~anatolstef/R/wc-novels.csv", header=TRUE, sep=",", quot="\"") -> novels +read.table(file="https://userpage.fu-berlin.de/~structeng/data/wc-novels.csv", header=TRUE, sep=",", quot="\"") -> novels 
 </code> </code>
  
r/de/first-steps.1718898587.txt.gz · Last modified: 2024/06/20 17:49 by astefanowitsch

Donate Powered by PHP Valid HTML5 Valid CSS Driven by DokuWiki