In diesem Artikel werden wir Variablen oder Spalten in der Programmiersprache R mithilfe der dplyr-Bibliothek auswählen.

Verwendeter Datensatz:

Spalte mit Spaltennamen auswählen

Hier verwenden wir die Methode select(), um die Spalte nach ihrem Namen auszuwählen

Syntax:

select(dataframe,column1,column2,.,column n)

Hier ist Datenrahmen der Eingabedatenrahmen und Spalten sind die Spalten im Datenrahmen, die angezeigt werden sollen

Beispiel 1: R-Programm zum Auswählen von Spalten

R

# load the library
library(dplyr)
  
# create dataframe with 3 columns
# id,name and address
data1=data.frame(id=c(1,2,3,4,5,6,7,1,4,2),
                   
                 name=c('sravan','ojaswi','bobby','gnanesh',
                        'rohith','pinkey','dhanush',
                        'sravan','gnanesh','ojaswi'),
                   
                 address=c('hyd','hyd','ponnur','tenali',
                           'vijayawada','vijayawada',
                           'guntur','hyd','tenali','hyd'))
  
# select id column from the dataframe by 
# column name
print(select(data1,id))
    
# select name column from the dataframe by
# column name
print(select(data1,name))

Ausgabe:

Beispiel 2 : R-Programm zur Auswahl mehrerer Spalten

R

# load the library
library(dplyr)
  
# create dataframe with 3 columns 
# id,name and address
data1=data.frame(id=c(1,2,3,4,5,6,7,1,4,2),
                   
                 name=c('sravan','ojaswi','bobby','gnanesh',
                        'rohith','pinkey','dhanush',
                        'sravan','gnanesh','ojaswi'),
                   
                 address=c('hyd','hyd','ponnur','tenali',
                           'vijayawada','vijayawada',
                           'guntur','hyd','tenali','hyd'))
  
# select multiple columns from the dataframe
# by column name
print(select(data1,id,name,address))

Ausgabe:

Spalte(n) nach Position auswählen

Wir können auch die Spaltenposition verwenden und die Spalte mit der Methode select() abrufen. Stelle beginnt mit 1.

Syntax:

select(dataframe,column1_position,column2_position,.,column n_position)

Dabei ist Datenrahmen der Eingabedatenrahmen und Spaltenposition eine Spaltennummer

Um mehrere Spalten auszuwählen, können wir den Bereichsoperator „;“ verwenden. um Spalten nach ihrer Position auszuwählen

Syntax:

select(dataframe,start_position:end_position)

Dabei ist dataframe der Eingabedatenframe, start_position ist die Startposition einer Spaltennummer und end_position ist die Endposition einer Spaltennummer



Beispiel 1: R-Programm zur Auswahl einer bestimmten spaltenweisen Position

R

# load the library
library(dplyr)
  
# create dataframe with 3 columns
# id,name and address
data1=data.frame(id=c(1,2,3,4,5,6,7,1,4,2),
                   
                 name=c('sravan','ojaswi','bobby','gnanesh',
                        'rohith','pinkey','dhanush',
                        'sravan','gnanesh','ojaswi'),
                   
                 address=c('hyd','hyd','ponnur','tenali',
                           'vijayawada','vijayawada',
                           'guntur','hyd','tenali','hyd'))
  
# select first column by column position
print(select(data1,1))
  
# select third column by column position
print(select(data1,3))
   

Ausgabe:

Beispiel 2: R-Programm zur Auswahl mehrerer Spalten nach Positionen

R

# load the library
library(dplyr)
  
# create dataframe with 3 columns 
# id,name and address
data1=data.frame(id=c(1,2,3,4,5,6,7,1,4,2),
                   
                 name=c('sravan','ojaswi','bobby','gnanesh',
                        'rohith','pinkey','dhanush','sravan',
                        'gnanesh','ojaswi'),
                   
                 address=c('hyd','hyd','ponnur','tenali',
                           'vijayawada','vijayawada','guntur',
                           'hyd','tenali','hyd'))
  
# select multiple column by column position
print(select(data1,1,2))

Ausgabe:

Beispiel 3: R-Programm zur Auswahl mehrerer Spalten nach Position mit Bereichsoperator

R

# load the library
library(dplyr)
  
# create dataframe with 3 columns 
# id,name and address
data1=data.frame(id=c(1,2,3,4,5,6,7,1,4,2),
                   
                 name=c('sravan','ojaswi','bobby','gnanesh',
                        'rohith','pinkey','dhanush','sravan',
                        'gnanesh','ojaswi'),
                   
                 address=c('hyd','hyd','ponnur','tenali',
                           'vijayawada','vijayawada','guntur',
                           'hyd','tenali','hyd'))
  
# select multiple column by column 
# position with : operator
print(select(data1,1:3))

Ausgabe:

Spalte auswählen, die einen Wert enthält oder einem Muster entspricht

Hier zeigen wir die Spaltenwerte basierend auf Werten oder Mustern an, die in der Spalte vorhanden sind 

Methode 1: Verwenden von contains() 

Zeigt die Spalte an, die die angegebene Teilzeichenfolge enthält

Syntax:

select(dataframe,contains('sub_string'))

Hier ist dataframe der Eingabedatenframe und sub_string ist die Zeichenfolge, die im Spaltennamen vorhanden ist

Beispiel: R-Programm zum Auswählen einer Spalte basierend auf einer Teilzeichenfolge

R

# load the library
library(dplyr)
  
# create dataframe with 3 columns 
# id,name and address
data1=data.frame(id=c(1,2,3,4,5,6,7,1,4,2),
                   
                 name=c('sravan','ojaswi','bobby','gnanesh',
                        'rohith','pinkey','dhanush','sravan',
                        'gnanesh','ojaswi'),
                   
                 address=c('hyd','hyd','ponnur','tenali',
                           'vijayawada','vijayawada','guntur',
                           'hyd','tenali','hyd'))
  
# select column that contains am
print(select(data1,contains('am')))
  
# select column that contains d
print(select(data1,contains('d')))
  
# select column that contains dd
print(select(data1,contains('dd')))

Ausgabe:

Methode 2: Streichhölzer verwenden()

Es überprüft und zeigt die Spalte an, die die angegebene Teilzeichenfolge enthält

select(dataframe,matchs('sub_string'))

Hier ist dataframe der Eingabedatenframe und sub_string ist die Zeichenfolge, die im Spaltennamen vorhanden ist

Beispiel: R-Programm zum Auswählen einer Spalte basierend auf einer Teilzeichenfolge

R

# load the library
library(dplyr)
  
# create dataframe with 3 columns 
# id,name and address
data1=data.frame(id=c(1,2,3,4,5,6,7,1,4,2),
                   
                 name=c('sravan','ojaswi','bobby','gnanesh',
                        'rohith','pinkey','dhanush','sravan',
                        'gnanesh','ojaswi'),
                   
                 address=c('hyd','hyd','ponnur','tenali',
                           'vijayawada','vijayawada','guntur',
                           'hyd','tenali','hyd'))
  
# select column that matches with  am
print(select(data1,matches('am')))
  
# select column that matches with d
print(select(data1,matches ('d')))
  
# select column that matches with  dd
print(select(data1,matches ('dd')))

Ausgabe:

Wählen Sie eine Spalte aus, die mit einem bestimmten Zeichen beginnt oder endet

Hier können wir auch Spalten basierend auf Anfangs- und Endzeichen auswählen.

  • starts_with() wird verwendet, um die Spalte zurückzugeben, die mit dem angegebenen Zeichen beginnt.

Syntax:

select(dataframe,starts_with('substring'))

Dabei ist Datenrahmen der Eingabedatenrahmen und Teilzeichenfolge das Zeichen/die Zeichenfolge, die damit beginnt

  • ended_with() wird verwendet, um die Spalte zurückzugeben, die mit dem angegebenen Zeichen endet.

Syntax:

select(dataframe,ends_with('substring'))

Dabei ist Datenrahmen der Eingabedatenrahmen und Teilzeichenfolge das Zeichen/die Zeichenfolge, die damit endet

Beispiel 1: R-Programm zum Anzeigen von Spalten, die mit einem Zeichen/Teilstring beginnen

R

# load the library
library(dplyr)
  
# create dataframe with 3 columns id,name and address
data1=data.frame(id=c(1,2,3,4,5,6,7,1,4,2),
                   
                 name=c('sravan','ojaswi','bobby','gnanesh',
                        'rohith','pinkey','dhanush','sravan',
                        'gnanesh','ojaswi'),
                   
                 address=c('hyd','hyd','ponnur','tenali',
                           'vijayawada','vijayawada','guntur',
                           'hyd','tenali','hyd'))
  
# select column that starts with n
print(select(data1,starts_with('n')))
  
# select column that starts with add
print(select(data1,starts_with('add')))

Ausgabe:

Beispiel 2: R-Programm zum Auswählen einer Spalte, die mit einer bestimmten Zeichenfolge oder einem bestimmten Zeichen endet

R

# load the library
library(dplyr)
  
# create dataframe with 3 columns id,name and address
data1=data.frame(id=c(1,2,3,4,5,6,7,1,4,2),
                   
                 name=c('sravan','ojaswi','bobby','gnanesh',
                        'rohith','pinkey','dhanush','sravan',
                        'gnanesh','ojaswi'),
                   
                 address=c('hyd','hyd','ponnur','tenali','vijayawada',
                           'vijayawada','guntur','hyd','tenali','hyd'))
  
# select column that ends with ss
print(select(data1,ends_with('ss')))
  
# select column that ends with d
print(select(data1,ends_with('d')))

Ausgabe:

Wählen Sie alle Spalten aus

Wir können alle Spalten im Datenrahmen auswählen, indem wir die Methode everything() verwenden.

Syntax :

select(dataframe,alles())

Beispiel : R-Programm zur Auswahl aller Spalten

R

# load the library
library(dplyr)
  
# create dataframe with 3 columns
# id,name and address
data1=data.frame(id=c(1,2,3,4,5,6,7,1,4,2),
                   
                 name=c('sravan','ojaswi','bobby','gnanesh',
                        'rohith','pinkey','dhanush','sravan',
                        'gnanesh','ojaswi'),
                   
                 address=c('hyd','hyd','ponnur','tenali',
                           'vijayawada','vijayawada','guntur',
                           'hyd','tenali','hyd'))
  
# select all columns using everything method
print(select(data1,everything()))

Ausgabe: