Wählen Sie Variablen (Spalten) in R mit Dplyr aus
In diesem Artikel werden wir Variablen oder Spalten in der Programmiersprache R mithilfe der dplyr-Bibliothek auswählen.
Verwendeter Datensatz:
Spalte mit Spaltennamen auswählen
Hier verwenden wir die Methode select(), um die Spalte nach ihrem Namen auszuwählen
Syntax:
select(dataframe,column1,column2,.,column n)
Hier ist Datenrahmen der Eingabedatenrahmen und Spalten sind die Spalten im Datenrahmen, die angezeigt werden sollen
Beispiel 1: R-Programm zum Auswählen von Spalten
R
# load the library library(dplyr) # create dataframe with 3 columns # id,name and address data1=data.frame(id=c(1,2,3,4,5,6,7,1,4,2), name=c('sravan','ojaswi','bobby','gnanesh', 'rohith','pinkey','dhanush', 'sravan','gnanesh','ojaswi'), address=c('hyd','hyd','ponnur','tenali', 'vijayawada','vijayawada', 'guntur','hyd','tenali','hyd')) # select id column from the dataframe by # column name print(select(data1,id)) # select name column from the dataframe by # column name print(select(data1,name))
Ausgabe:
Beispiel 2 : R-Programm zur Auswahl mehrerer Spalten
R
# load the library library(dplyr) # create dataframe with 3 columns # id,name and address data1=data.frame(id=c(1,2,3,4,5,6,7,1,4,2), name=c('sravan','ojaswi','bobby','gnanesh', 'rohith','pinkey','dhanush', 'sravan','gnanesh','ojaswi'), address=c('hyd','hyd','ponnur','tenali', 'vijayawada','vijayawada', 'guntur','hyd','tenali','hyd')) # select multiple columns from the dataframe # by column name print(select(data1,id,name,address))
Ausgabe:
Spalte(n) nach Position auswählen
Wir können auch die Spaltenposition verwenden und die Spalte mit der Methode select() abrufen. Stelle beginnt mit 1.
Syntax:
select(dataframe,column1_position,column2_position,.,column n_position)
Dabei ist Datenrahmen der Eingabedatenrahmen und Spaltenposition eine Spaltennummer
Um mehrere Spalten auszuwählen, können wir den Bereichsoperator „;“ verwenden. um Spalten nach ihrer Position auszuwählen
Syntax:
select(dataframe,start_position:end_position)
Dabei ist dataframe der Eingabedatenframe, start_position ist die Startposition einer Spaltennummer und end_position ist die Endposition einer Spaltennummer
Beispiel 1: R-Programm zur Auswahl einer bestimmten spaltenweisen Position
R
# load the library library(dplyr) # create dataframe with 3 columns # id,name and address data1=data.frame(id=c(1,2,3,4,5,6,7,1,4,2), name=c('sravan','ojaswi','bobby','gnanesh', 'rohith','pinkey','dhanush', 'sravan','gnanesh','ojaswi'), address=c('hyd','hyd','ponnur','tenali', 'vijayawada','vijayawada', 'guntur','hyd','tenali','hyd')) # select first column by column position print(select(data1,1)) # select third column by column position print(select(data1,3))
Ausgabe:
Beispiel 2: R-Programm zur Auswahl mehrerer Spalten nach Positionen
R
# load the library library(dplyr) # create dataframe with 3 columns # id,name and address data1=data.frame(id=c(1,2,3,4,5,6,7,1,4,2), name=c('sravan','ojaswi','bobby','gnanesh', 'rohith','pinkey','dhanush','sravan', 'gnanesh','ojaswi'), address=c('hyd','hyd','ponnur','tenali', 'vijayawada','vijayawada','guntur', 'hyd','tenali','hyd')) # select multiple column by column position print(select(data1,1,2))
Ausgabe:
Beispiel 3: R-Programm zur Auswahl mehrerer Spalten nach Position mit Bereichsoperator
R
# load the library library(dplyr) # create dataframe with 3 columns # id,name and address data1=data.frame(id=c(1,2,3,4,5,6,7,1,4,2), name=c('sravan','ojaswi','bobby','gnanesh', 'rohith','pinkey','dhanush','sravan', 'gnanesh','ojaswi'), address=c('hyd','hyd','ponnur','tenali', 'vijayawada','vijayawada','guntur', 'hyd','tenali','hyd')) # select multiple column by column # position with : operator print(select(data1,1:3))
Ausgabe:
Spalte auswählen, die einen Wert enthält oder einem Muster entspricht
Hier zeigen wir die Spaltenwerte basierend auf Werten oder Mustern an, die in der Spalte vorhanden sind
Methode 1: Verwenden von contains()
Zeigt die Spalte an, die die angegebene Teilzeichenfolge enthält
Syntax:
select(dataframe,contains('sub_string'))
Hier ist dataframe der Eingabedatenframe und sub_string ist die Zeichenfolge, die im Spaltennamen vorhanden ist
Beispiel: R-Programm zum Auswählen einer Spalte basierend auf einer Teilzeichenfolge
R
# load the library library(dplyr) # create dataframe with 3 columns # id,name and address data1=data.frame(id=c(1,2,3,4,5,6,7,1,4,2), name=c('sravan','ojaswi','bobby','gnanesh', 'rohith','pinkey','dhanush','sravan', 'gnanesh','ojaswi'), address=c('hyd','hyd','ponnur','tenali', 'vijayawada','vijayawada','guntur', 'hyd','tenali','hyd')) # select column that contains am print(select(data1,contains('am'))) # select column that contains d print(select(data1,contains('d'))) # select column that contains dd print(select(data1,contains('dd')))
Ausgabe:
Methode 2: Streichhölzer verwenden()
Es überprüft und zeigt die Spalte an, die die angegebene Teilzeichenfolge enthält
select(dataframe,matchs('sub_string'))
Hier ist dataframe der Eingabedatenframe und sub_string ist die Zeichenfolge, die im Spaltennamen vorhanden ist
Beispiel: R-Programm zum Auswählen einer Spalte basierend auf einer Teilzeichenfolge
R
# load the library library(dplyr) # create dataframe with 3 columns # id,name and address data1=data.frame(id=c(1,2,3,4,5,6,7,1,4,2), name=c('sravan','ojaswi','bobby','gnanesh', 'rohith','pinkey','dhanush','sravan', 'gnanesh','ojaswi'), address=c('hyd','hyd','ponnur','tenali', 'vijayawada','vijayawada','guntur', 'hyd','tenali','hyd')) # select column that matches with am print(select(data1,matches('am'))) # select column that matches with d print(select(data1,matches ('d'))) # select column that matches with dd print(select(data1,matches ('dd')))
Ausgabe:
Wählen Sie eine Spalte aus, die mit einem bestimmten Zeichen beginnt oder endet
Hier können wir auch Spalten basierend auf Anfangs- und Endzeichen auswählen.
- starts_with() wird verwendet, um die Spalte zurückzugeben, die mit dem angegebenen Zeichen beginnt.
Syntax:
select(dataframe,starts_with('substring'))
Dabei ist Datenrahmen der Eingabedatenrahmen und Teilzeichenfolge das Zeichen/die Zeichenfolge, die damit beginnt
- ended_with() wird verwendet, um die Spalte zurückzugeben, die mit dem angegebenen Zeichen endet.
Syntax:
select(dataframe,ends_with('substring'))
Dabei ist Datenrahmen der Eingabedatenrahmen und Teilzeichenfolge das Zeichen/die Zeichenfolge, die damit endet
Beispiel 1: R-Programm zum Anzeigen von Spalten, die mit einem Zeichen/Teilstring beginnen
R
# load the library library(dplyr) # create dataframe with 3 columns id,name and address data1=data.frame(id=c(1,2,3,4,5,6,7,1,4,2), name=c('sravan','ojaswi','bobby','gnanesh', 'rohith','pinkey','dhanush','sravan', 'gnanesh','ojaswi'), address=c('hyd','hyd','ponnur','tenali', 'vijayawada','vijayawada','guntur', 'hyd','tenali','hyd')) # select column that starts with n print(select(data1,starts_with('n'))) # select column that starts with add print(select(data1,starts_with('add')))
Ausgabe:
Beispiel 2: R-Programm zum Auswählen einer Spalte, die mit einer bestimmten Zeichenfolge oder einem bestimmten Zeichen endet
R
# load the library library(dplyr) # create dataframe with 3 columns id,name and address data1=data.frame(id=c(1,2,3,4,5,6,7,1,4,2), name=c('sravan','ojaswi','bobby','gnanesh', 'rohith','pinkey','dhanush','sravan', 'gnanesh','ojaswi'), address=c('hyd','hyd','ponnur','tenali','vijayawada', 'vijayawada','guntur','hyd','tenali','hyd')) # select column that ends with ss print(select(data1,ends_with('ss'))) # select column that ends with d print(select(data1,ends_with('d')))
Ausgabe:
Wählen Sie alle Spalten aus
Wir können alle Spalten im Datenrahmen auswählen, indem wir die Methode everything() verwenden.
Syntax :
select(dataframe,alles())
Beispiel : R-Programm zur Auswahl aller Spalten
R
# load the library library(dplyr) # create dataframe with 3 columns # id,name and address data1=data.frame(id=c(1,2,3,4,5,6,7,1,4,2), name=c('sravan','ojaswi','bobby','gnanesh', 'rohith','pinkey','dhanush','sravan', 'gnanesh','ojaswi'), address=c('hyd','hyd','ponnur','tenali', 'vijayawada','vijayawada','guntur', 'hyd','tenali','hyd')) # select all columns using everything method print(select(data1,everything()))
Ausgabe: