https://github.com/mbouzid/5980_2024-1_taller_3
https://github.com/mbouzid/5980_2024-1_taller_3
Last synced: 3 months ago
JSON representation
- Host: GitHub
- URL: https://github.com/mbouzid/5980_2024-1_taller_3
- Owner: mbouzid
- Created: 2024-03-18T11:39:42.000Z (over 1 year ago)
- Default Branch: main
- Last Pushed: 2024-03-23T03:52:51.000Z (about 1 year ago)
- Last Synced: 2025-03-29T02:44:45.139Z (3 months ago)
- Language: Python
- Size: 8.71 MB
- Stars: 0
- Watchers: 1
- Forks: 1
- Open Issues: 1
-
Metadata Files:
- Readme: README.md
Awesome Lists containing this project
README
#ESTEBAN BERNAL-NICOLAS ALMONACID-JUAN GOMEZ-FELIPE ABELLA
# Ejercicio 3## 1. ¿Cuántos k-mers se generan por una secuencia de longitud |S|?
El número de k-mers se calcula utilizando la fórmula:
Número de k-mers = S - k + 1
= 304552 - 5 + 1 = 304548## 2. ¿Cuál es la complejidad en tiempo del algoritmo de descomposición en k-mers de una secuencia S dada?
Dado que la longitud de la secuencia S es mucho mayor que la longitud de los k-mers k en este caso, se puede simplificar la complejidad a O(S). Entonces, la complejidad en tiempo del algoritmo sería aproximadamente O(304552), es decir, O(304552).
# Ejercicio 2
## 1. La complejidad en tiempo del algoritmo
La complejidad en tiempo del algoritmo es O(n), donde n es la longitud de las secuencias. Esto se debe a que el algoritmo recorre ambas secuencias una vez para calcular la distancia de Hamming.
## 2. Limitaciones del algoritmo de distancia de Hamming
La principal limitación es que la distancia de Hamming no tiene en cuenta las inserciones, eliminaciones o reordenamientos de bases en las secuencias de ADN. Es decir, solo mide la diferencia en caracteres en las mismas posiciones entre las secuencias. En biología molecular, las mutaciones y cambios genéticos pueden implicar no solo diferencias en bases individuales, sino también cambios estructurales en la secuencia. Por lo tanto, la distancia de Hamming puede subestimar la divergencia real entre las secuencias de ADN. Para tener en cuenta estas variaciones estructurales, se pueden utilizar otras medidas de similitud o distancia, como la distancia de Levenshtein o algoritmos de alineamiento de secuencias.