Использование LocalBlast (или BLAST+) для поиска и загрузки генетических данных

By | 1 January 2012

Для ускорения процесса поиска данных через BLAST в скрипт для поиска и загрузки данных с помощью интерфейсов BLAST/Entrez.  добавлен небольшой блок кода, который позволяет обращаться непосредственно к локальной базе данных BLAST через интерфейс BLAST+.  При использовании локальной базы данных время поиска сокращается в ~4 раза.

Для запуска скрипта и поиска в локальной базе данных потребуется установленная на вашем компьютере (или на сервере организации) база БЛАСТ (инструкцию по установке базы на локальном компьютере можно найти здесь), а также скаченные файлы с данными NCBI (скачать с ftp-сервера NCBI). Кроме того, если база будет установлена на компьютере с OS Windows для корректной работы скрипта потребуется прописывание переменных среды path к исполняемым файлам (папка bin) и создание новой переменной BLASTDB к директории с файлами базы (папка db).

При использовании скрипта (скачать полный скрипт здесь; логин: public, пароль: cornus) будут предоставлены два варианта запуска: интерактивный и командная строка. Интерактивный режим будет запущен, если скрипт будет запущен без каких-либо параметров:

 Для ускорения процесса поиска данных через BLAST в скрипт для поиска и загрузки данных с помощью интерфейсов BLAST/Entrez.  добавлен небольшой блок кода, который позволяет обращаться непосредственно к локальной базе данных BLAST через интерфейс BLAST+.  При использовании локальной базы данных время поиска сокращается в ~4 раза.

Для запуска скрипта и поиска в локальной базе данных потребуется установленная на вашем компьютере (или на сервере организации) база БЛАСТ (инструкцию по установке базы на локальном компьютере можно найти здесь), а также скаченные файлы с данными NCBI (скачать с ftp-сервера NCBI). Кроме того, если база будет установлена на компьютере с OS Windows для корректной работы скрипта потребуется прописывание переменных среды path к исполняемым файлам (папка bin) и создание новой переменной BLASTDB к директории с файлами базы (папка db).

При использовании скрипта (скачать полный скрипт здесь; логин: public, пароль: cornus) будут предоставлены два варианта запуска: интерактивный и командная строка. Интерактивный режим будет запущен, если скрипт будет запущен без каких-либо параметров:

python genbank_2_fasta_local.py

#Do blastn search against local database and return results in xml file


GeSHi Error: GeSHi could not find the language pythonlines (using path /home8/phyloge1/public_html/wp-content/plugins/codecolorer/lib/geshi/) (code 2)

fasta_file = organism+’_’+seq_id+’.fasta’

#a quick and dirty way to run blastdbcmd – should be used a wrapper instead (but
request_blastdbcmd = ‘blastdbcmd -db ‘ + db_name + ‘ -entry ‘ + seq_id + ‘ -out ‘ + fasta_file

print request_blastdbcmd
return_code = os.system(request_blastdbcmd)


GeSHi Error: GeSHi could not find the language pythonlines (using path /home8/phyloge1/public_html/wp-content/plugins/codecolorer/lib/geshi/) (code 2)