Это мой небольшой массив данных

head(ATAC_fc_plot)
          ENSEMBL    Peak log2FoldChange
1 ENSG00000230368   Peak4       1.565676
2 ENSG00000230368   Peak6       2.537395
3 ENSG00000230368   Peak7      -1.543704
4 ENSG00000230368   Peak8      -3.498416
5 ENSG00000067606 Peak112       1.982703
6 ENSG00000067606 Peak113       2.035416

У меня эти ряды повторяются из-за различных уровней обогащения, поэтому мне нужно взять итоговое среднее значение каждого ряда. Например, у меня есть 4 наблюдения "ENSG00000230368", которые я хотел бы сделать одним рядом со средним значением.

Вывод, который я хотел бы видеть, это "ENSG00000230368" и "ENSG00000067606". Средний столбец является для меня справочником, как каждый ген исходит из какого пика. Поэтому его можно удалить, если это проблема.

Помощь была бы очень признательна.

PesKchan

Ответов: 1

Ответы (1)

Вы можете сделать это с помощью пакета dplyr:

library(dplyr)

ATAC_fc_plot %>%
  group_by(ENSEMBL) %>%
  summarize(average = mean(log2FoldChange, na.rm = TRUE))

2022 WebDevInsider