Во-первых, проблема представлена
Streptomyces рода найден в гене hrdb промотора (hrdbp) консервативных последовательностей, в надежде вывести области -10 и -35 области.
Во-вторых, процесс
1, 15-20 загрузки гена hrdb последовательность промотора, и обрабатывают, чтобы сформировать файл FASTA
От 1,1 до coelicolor A3 (2) в качестве источника гена hrdb, взрыва найти самый высокий балл из первых 50 последовательностей. Таблица формат Скачать файл Hit (TXT), заголовок файла покажет вам, что отображается в каждом столбце.
Затем откройте файл с Excel, в первую очередь длины выравнивания менее 1500bp удаления, найти предмет acc.ver, s.start и s.end эти три, три ждать, чтобы использовать его для создания URL.
Пример URL: HTTPS: //www.ncbi.nlm.nih.gov/nuccore/LT629768.1 отчет = FASTA и от = 6444177 & к = 6445864, сгенерированный код следующим URL ?:
1 # 读入数据 2 FO = открыт ( ' D: \\ \\ временный hrdb_related \\ ZECB16FT01N-Alignment.csv ' , ' г ' ) 3 Ls = [] 4 для линии в ВОК: 5 линия = line.replace ( ' \ п ' , '' ) 6 ls.append (line.split ( ' ' )) 7 fo.close () 8 # 写出成URL 9 FO1 = открыт ( " D: \\ \\ временный \\ hrdb_related output.csv ' , ' W ' ) 10 для линии в LS: . 11 ЕСЛИ линия [-1] == ' 0 ' : # 0 указывает вперед последовательность, может быть использована s.start-400 s.stsrt + 5, а также начало и конец делать позиция 12 является fo1.write ( ' https://www.ncbi.nlm.nih.gov/nuccore/ ' + линия [. 1] + \ 13 ' ? = FASTA и отчет от = ' + Line [. 9] + ' & = к ' линия + [. 11] + ' \ n- ' ) 14 fo1.close ()
1,2, хотели, чтобы получить соответствующую последовательность двадцать URL непосредственно с рептилиями, но обнаружил, что соответствующая последовательность шифруется в Интернете искать немного, кажется, связана с асинхронной загрузкой. Открою прямое руководство для каждого URL, загрузить соответствующие последовательности, так что я получил 20 Fasta файлов, каждый из которых содержит последовательность.
1,3, следующий Пытаемся 20 Fasta файлов в один файл, множественную последовательность для последующего сравнения. Я слышал, команда кошка может быть решена под Linux, так что я хочу, чтобы отправить эти файлы на Linux виртуальной машине, попробуйте WinSCP3, но никакой связи не будет успешным, режим NAT может быть объединены в сеть, но даже не изменение в режиме моста в сети, так WinSCP3 не удалось успешно подключиться к Linux виртуальной машине. Позже он был найден под DOS WIN10 может достигнуть ту же функцию с помощью команды копирования. Просто нужно поместить все имена файлов, которые будут объединены с плюсом зарегистрируетесь, немного неприятностей. Он реализован в коде.
1 импорт ОС 2 для (DIRNAME, подкаталог, подтекста) в os.walk (г ' D: \ временного \ hrdb_related ' ): 3 для F в подтексте: 4 печати (F + ' + ' , конец = '' )
Для того, чтобы получить здесь FASTA файл может быть использован для множественного выравнивания последовательности.
2, мемом анализ и анализ мега
В выравнивания последовательностей мега Ридо находится выше по потоку от стартового кодона 200 б.п. очень консервативны; анализ по мемому из трех консервативных областей, с результатами, по сравнению с clustax пропустили вверх по течению 100-150bp, но некоторые на самом деле очень консервативный кажется мем имеет некоторые ограничения.
Здесь менее успешные попытки более, непосредственно перед стартовым кодоном 200 б.п. получить очень консервативный вывод, и это уже давно не поступало. И нет никаких соответствующих последовательностей в области -10 и -35 области.
3, в дополнение к выше анализа, я попытался прямой промотор предсказания онлайн программного обеспечения. Streptomyces может быть связано с содержанием GC слишком высока, программное обеспечение прогнозирования суб-предсказание не начинается с специальных бактерий или крайне неточным, но не смогли найти правильный онлайн программного обеспечения.