In diesem Artikel werden wir erörtern, wie Zeilen innerhalb der Gruppe des Datenrahmens in der Programmiersprache R nummeriert werden

Methode 1: Verwenden der Funktion ave()

Rufen Sie die ave()-Funktion auf, die eine Basisfunktion der R-Sprache ist, und übergeben Sie die erforderlichen Parameter an diese Funktion, und dieser Prozess führt zu den Nummerierungszeilen innerhalb der Gruppe des angegebenen Datenrahmens in der R-Programmiersprache.

Die Funktion ave() wird für Teilmengen von x[] verwendet, die gemittelt werden, wobei jede Teilmenge aus Beobachtungen mit denselben Faktorstufen besteht.

Syntax:

ave(x, …, SPASS = gemein)



Parameter:

  • x: Eine Zahl.
  • … : Gruppieren von Variablen, typischerweise Faktoren, die alle die gleiche Länge wie x haben.
  • FUN: Funktion, die für jede Faktorstufenkombination anzuwenden ist

Beispiel: Nummerierung von Zeilen innerhalb von Gruppen

R

gfg<-data.frame(x=1:20,group=c(rep("g1", 8),
                               rep("g2", 5),
                               rep("g3",4),
                               rep("g4",3)))
  
gfg$numbering <- ave(gfg$x,gfg$group,FUN = seq_along)
  
gfg

Ausgabe:

Methode 2: Verwenden der Funktion mutate() aus dem Paket dplyr

Bei diesem Ansatz zum Nummerieren von Zeilen innerhalb der Gruppe des Datenrahmens mit der ave-Funktion muss der Benutzer das dplyr-Paket in der funktionierenden R-Konsole installieren und importieren, hier muss dieses Paket importiert werden, da die Funktion mutate() die darin vorhandene Funktion ist dieser speziellen Bibliothek, dann muss der Benutzer die Funktion mutate() mit dem erforderlichen übergebenen Parameter aufrufen, um die Nummerierungszeilen innerhalb der Gruppe des angegebenen Datenrahmens in der Programmiersprache R zu erhalten.

Die Funktion mutate() wird zum Mutieren verwendet, fügt neue Variablen hinzu und behält vorhandene bei; transmute löscht vorhandene Variablen.

Syntax:

mutate(.data, …)

Parameter:

  • .data: Ein Tabl. Alle Hauptverben sind S3-Generika und bieten Methoden für tbl_df, tbl_dt und tbl_sql.
  • … : Name-Wert-Paare von Ausdrücken. Verwenden Sie NULL, um eine Variable zu löschen.

Beispiel: Nummerierung von Zeilen innerhalb von Gruppen

R

library("dplyr")
  
gfg<-data.frame(x=1:20,group=c(rep("g1", 8),rep("g2", 5),
                               rep("g3",4),rep("g4",3)))
  
gfg <- gfg %>%                            
 group_by(group) %>%
 mutate(numbering = row_number())
  
gfg

Ausgabe: