Найти последовательность обработки загрузки (NCBI) из множественного выравнивания ---- записать менее успешную попытку

Во-первых, проблема представлена

Streptomyces рода найден в гене hrdb промотора (hrdbp) консервативных последовательностей, в надежде вывести области -10 и -35 области.

Во-вторых, процесс

1, 15-20 загрузки гена hrdb последовательность промотора, и обрабатывают, чтобы сформировать файл FASTA

От 1,1 до coelicolor A3 (2) в качестве источника гена hrdb, взрыва найти самый высокий балл из первых 50 последовательностей. Таблица формат Скачать файл Hit (TXT), заголовок файла покажет вам, что отображается в каждом столбце.

Затем откройте файл с Excel, в первую очередь длины выравнивания менее 1500bp удаления, найти предмет acc.ver, s.start и s.end эти три, три ждать, чтобы использовать его для создания URL.

Пример URL: HTTPS: //www.ncbi.nlm.nih.gov/nuccore/LT629768.1 отчет = FASTA и от = 6444177 & к = 6445864, сгенерированный код следующим URL ?:

1  # 读入数据
2 FO = открыт ( ' D: \\ \\ временный hrdb_related \\ ZECB16FT01N-Alignment.csv ' , ' г ' )
 3 Ls = []
 4  для линии в ВОК:
 5      линия = line.replace ( ' \ п ' , '' )
 6      ls.append (line.split ( ' ' ))
 7 fo.close ()
 8 # 写出成URL 9 FO1 = открыт ( " D: \\ \\ временный \\ hrdb_related output.csv ' ,  
' W ' )
 10  для линии в LS:
 . 11      ЕСЛИ линия [-1] == ' 0 ' : # 0 указывает вперед последовательность, может быть использована s.start-400 s.stsrt + 5, а также начало и конец делать позиция
 12 является          fo1.write ( ' https://www.ncbi.nlm.nih.gov/nuccore/ ' + линия [. 1] + \
 13                ' ? = FASTA и отчет от = ' + Line [. 9] + ' & = к ' линия + [. 11] + ' \ n- ' )
 14 fo1.close ()

1,2, хотели, чтобы получить соответствующую последовательность двадцать URL непосредственно с рептилиями, но обнаружил, что соответствующая последовательность шифруется в Интернете искать немного, кажется, связана с асинхронной загрузкой. Открою прямое руководство для каждого URL, загрузить соответствующие последовательности, так что я получил 20 Fasta файлов, каждый из которых содержит последовательность.

1,3, следующий Пытаемся 20 Fasta файлов в один файл, множественную последовательность для последующего сравнения. Я слышал, команда кошка может быть решена под Linux, так что я хочу, чтобы отправить эти файлы на Linux виртуальной машине, попробуйте WinSCP3, но никакой связи не будет успешным, режим NAT может быть объединены в сеть, но даже не изменение в режиме моста в сети, так WinSCP3 не удалось успешно подключиться к Linux виртуальной машине. Позже он был найден под DOS WIN10 может достигнуть ту же функцию с помощью команды копирования. Просто нужно поместить все имена файлов, которые будут объединены с плюсом зарегистрируетесь, немного неприятностей. Он реализован в коде.

1  импорт ОС
 2  для (DIRNAME, подкаталог, подтекста) в os.walk (г ' D: \ временного \ hrdb_related ' ):
 3      для F в подтексте:
 4          печати (F + ' + ' , конец = '' )

Для того, чтобы получить здесь FASTA файл может быть использован для множественного выравнивания последовательности.

2, мемом анализ и анализ мега

В выравнивания последовательностей мега Ридо находится выше по потоку от стартового кодона 200 б.п. очень консервативны; анализ по мемому из трех консервативных областей, с результатами, по сравнению с clustax пропустили вверх по течению 100-150bp, но некоторые на самом деле очень консервативный кажется мем имеет некоторые ограничения.

Здесь менее успешные попытки более, непосредственно перед стартовым кодоном 200 б.п. получить очень консервативный вывод, и это уже давно не поступало. И нет никаких соответствующих последовательностей в области -10 и -35 области.

3, в дополнение к выше анализа, я попытался прямой промотор предсказания онлайн программного обеспечения. Streptomyces может быть связано с содержанием GC слишком высока, программное обеспечение прогнозирования суб-предсказание не начинается с специальных бактерий или крайне неточным, но не смогли найти правильный онлайн программного обеспечения.

рекомендация

отwww.cnblogs.com/s-qw/p/12089150.html
рекомендация