Ecosyste.ms: Awesome

An open API service indexing awesome lists of open source software.

Awesome Lists | Featured Topics | Projects

https://github.com/vmesel/phagedisplay

scripts for the phagedisplay experiment
https://github.com/vmesel/phagedisplay

Last synced: 16 days ago
JSON representation

scripts for the phagedisplay experiment

Host: GitHub
URL: https://github.com/vmesel/phagedisplay
Owner: vmesel
Created: 2017-08-20T14:39:08.000Z (over 7 years ago)
Default Branch: master
Last Pushed: 2017-10-28T12:30:12.000Z (about 7 years ago)
Last Synced: 2024-11-18T03:40:02.437Z (2 months ago)
Language: Python
Size: 23.4 KB
Stars: 1
Watchers: 2
Forks: 0
Open Issues: 0
Metadata Files:
- Readme: README.md

Awesome Lists containing this project

README

# Pipeline para desenvolvimento de sequências para Phage Display

Para o desenvolvimento de um pipeline de sequências das sequencias a serem utilizadas no experimento de phage display, eu criei este repositório que contém o código de preenchimento e trimming de sequências.

O pipeline inteiro é:
```bash
sed "s/\*$//" ORIGINAL-FASTAFILE.FASTA > PRE_FASTAFILE.fasta
sed "s/|.*//" ORIGINAL-FASTAFILE.FASTA > PRE_FASTAFILE.fasta
pyfasta split -n 1 -k 52 -o 7 FASTAFILE.fasta
sed "s/$[0-9]$_$-\?[0-9]$/\1\|\2/g" PRE_FASTAFILE.fasta > FASTAFILE.fasta
python phagedisplay/fasta_normalizer.py -n -f FASTAFILE_OUTPUT_FROM_PYFASTA_HERE.fasta -l 52 -o 7 -of FASTAFILE-OUTPUTNAME_HERE.fasta
python phagedisplay/fasta_normalizer.py -c -f FASTAFILE-OUTPUTNAME_HERE.fasta -w x -of FASTAFILE-OUTPUTNAME_HERE.fasta.clean
python phagedisplay/fasta_normalizer.py -p -f FASTAFILE-OUTPUTNAME_HERE.fasta.clean -of FASTAFILE-OUTPUTNAME_HERE.fasta.pep
makeblastdb -in FASTAFILE-OUTPUTNAME_HERE.fasta.pep -dbtype prot
blastp -task blastp -db FASTAFILE-OUTPUTNAME_HERE.fasta.pep -query FASTAFILE-OUTPUTNAME_HERE.fasta.pep -outfmt 6 -qcov_hsp_perc 100 -out blast-peptide.blast
awk '{if ($3 == 100) print $0}' blast-peptide.blast > blastOUT-filtered100id.blast
```

## fasta_normalizer.py

Para utilizar o fasta_normalizer.py na linha de comando, você deve passar os seguintes parâmetros:

```
Você deve escolher uma ação que deve ser falada no inicio do comando
-n ou --fasta_normalizer - Para normalizar o fasta para o mesmo tamanho de sequencias
-p ou --peptide-fasta - Transformar um fasta de DNA para Peptídeos
-c ou --fasta-cleaner - Para realizar a limpeza do fasta (remoção das sequências com alfabeto estranho)

E preencher com os dados que são requeridos por ela
-f ou -file : Arquivo de input
-l ou -length : Tamanho desejado das sequencias
-o ou -overlap : Tamanho do overlap das sequencias
-of ou --output_file : Arquivo de output das sequencias
```