Организм: human.
Гистоновая метка: H3K9me3.
Тип клеток: A549.
ChIP-seq эксперименты:
Построим гистограммы распределения длин участков для каждого из экспериментов (ENCFF444EWQ, ENCFF811QUJ) до и после конвертации из версии генома hg38 в hg19.
Гистограммы длин пиков не поменялись, никаких аномалий не произошло, поэтому можно переходить к следующим шагам.
Команды:
liftOver H3K9me3_A549.ENCFF444EWQ.hg38.bed hg38ToHg19.over.chain.gz H3K9me3_A549.ENCFF444EWQ.hg19.bed H3K9me3_A549.ENCFF444EWQ.unmapped.bed
liftOver H3K9me3_A549.ENCFF811QUJ.hg38.bed hg38ToHg19.over.chain.gz H3K9me3_A549.ENCFF811QUJ.hg19.bed H3K9me3_A549.ENCFF811QUJ.unmapped.bed
Для каждого из экспериментов удалим пики, которые имеют длину (> 5000). Снова нарисуем гистограммы распределения длин участков.
Посмотрим, где располагаются пики гистоновой метки относительно аннотированных генов. Для этого построим pie-chart с помощью R-библиотеки ChIPseeker.
Построим объединение участков из экспериментов ENCFF444EWQ и ENCFF811QUJ. После этого построим пересечение с вторичной структурой ДНК.
Команды:
cat *.filtered.bed | sort -k1,1 -k2,2n | bedtools merge > H3K9me3_A549.merge.hg19.bed
bedtools intersect -a DeepZ.bed -b H3K9me3_A549.merge.hg19.bed > H3K9me3_A549.intersect_with_DeepZ.bed
Визуализируем в геномном браузере:
- эксперимент ENCFF444EWQ (название ENCFF444EWQ)
- эксперимент ENCFF811QUJ (название ENCFF811QUJ)
- вторичная структура ДНК (название DeepZ)
- объединение экспериментов (название ChIP_merge)
- пересечение со вторичной структурой ДНК (название intersect_with_DeepZ)
Ссылка на сессию в UCSC GenomeBrowser: https://genome.ucsc.edu/s/isaf27/hse21_H3K9me3_ZDNA_human
Приведем два примера различных пересечений:
- Пересечение двух экспериментов, а также вторичной структуры ДНК. Его можно увидеть на гене ZNF585A, координаты chr19:37,657,445-37,672,018.
- Пересечение объединения двух экспериментов и вторичной структуры ДНК. Его можно увидеть в межгенном пространстве, координаты chr1:2,787,757-2,788,245.
С помощью R-библиотеки ChIPpeakAnno сделаем ассоциацию полученных пиков (в пересечении с вторичной структурой ДНК) с ближайшими генами.
Всего удалось проассоциировать 133 пика, получилось 92 уникальных гена.
Проведем GO-анализ для полученных уникальных генов при помощи сайта http://pantherdb.org/. Получаем следующий список категорий: