https://github.com/tsar123/neutral-single-nucleotide-polymorphisms-analysis
analysis of data on neutral single nucleotide polymorphisms
https://github.com/tsar123/neutral-single-nucleotide-polymorphisms-analysis
dna-polymorphism matplotlib numpy pandas seaborn snv
Last synced: about 2 months ago
JSON representation
analysis of data on neutral single nucleotide polymorphisms
- Host: GitHub
- URL: https://github.com/tsar123/neutral-single-nucleotide-polymorphisms-analysis
- Owner: tsar123
- Created: 2024-09-15T18:46:21.000Z (8 months ago)
- Default Branch: main
- Last Pushed: 2024-09-18T10:17:04.000Z (8 months ago)
- Last Synced: 2025-02-12T02:38:07.654Z (3 months ago)
- Topics: dna-polymorphism, matplotlib, numpy, pandas, seaborn, snv
- Language: Jupyter Notebook
- Homepage:
- Size: 2.46 MB
- Stars: 0
- Watchers: 1
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
Awesome Lists containing this project
README
# neutral-single-nucleotide-polymorphisms-analysis
# О наборе данных
0. Rs_id (идентификатор SNP)
- Уникальный номер, присвоенный конкретному варианту нуклеотидной последовательности в базе данных, например, dbSNP.1. ContigPositionStart_0_based (начальная позиция континга)
- Позиция начала варианта в континге, где 0 означает, что первая нуклеотидная позиция имеет индекс 0.2. ContigPositionEnd_0_based (конечная позиция континга)
- Позиция конца варианта в континге, также с нумерацией с нуля.3. GenomeBuild (версия сборки генома)
- Указывает на конкретную версию геномной сборки, используемую для аннотации данных.4. mRNA_acc_version (доступный номер версии mRNA)
- Уникальный идентификатор для транскрипта мРНК, который может включать информацию о версии.5. mRNA_start_position_0_based (начальная позиция мРНК)
- Позиция начала мРНК, где начинается кодирующая последовательность.6. mRNA_end_position_0_based (конечная позиция мРНК)
- Позиция конца мРНК, где заканчивается кодирующая последовательность.7. ReadingFrame_base_position_in_codon (позиция в кодоне в рамках рамки считывания)
- Указывает на положение нуклеотида в кодоне (0, 1 или 2).8. MissenseAllele (аллель с изменением)
- Аллель, содержащий мутацию, которая меняет одну аминокислоту на другую в белке.9. MissenseCodon (кодон, кодирующий изменённую аминокислоту)
- Кодон, который после мутации кодирует аминокислоту, отличающуюся от исходной.10. ReferenceAllele (эталонный аллель)
- Аллель, который считается стандартным для данной позиции в геноме; используется для сравнения с другими аллелями.11. ReferenceCodon (эталонный кодон)
- Кодон, который соответствует эталонному аллелю и кодирует аминокислоту до мутации.12. AminoAcidPosition_0_based (позиция аминокислоты)
- Позиция аминокислоты в белке, где 0 обозначает первую аминокислоту.# Предварительный анализ данных
Результаты:
- ContigPositionStart_0_based
- ContigPositionEnd_0_based
- mRNA_start_position_0_based
- mRNA_end_position_0_based
- ReadingFrame_base_position_in_codon
- AminoAcidPosition_0_based
# Корреляционный анализ данных
Столбчатая диаграмма корреляций:
Тепловая карта корреляции:
