Рейтинг:0

Как вырезать интервалы строк файла и поместить их в несколько файлов?

флаг af

У меня есть файл fasta, содержащий такие идентификаторы и последовательности:

>4S3O_2:С
GSMSQAVQTNGTQPLSKTWELSLYELQRTPQEAITDGLEIVVSPRSLHSELMCPICLDMLKNTMTTKECLHRFCADCIITALRSGNKECPTCRKKLVSKRSLRPDPNFDALISKIYPS
>5JH8_1:А
ААМВЛАЙЫСГЯГНИААЛТРЯАСФНАВАВДФИНИТАКГАВТГНДПАНДАЙСФЛЛГРКИПАЙГКВСНВДГГНВСАДИЯХАВСТСАQСКАВАНЛВКФАQДКРФСГИНВДФЭАВАКАГДРННФШФИ

Я хочу рекурсивно вырезать строки, содержащие идентификаторы и последовательности, и поместить их в новые несколько файлов, названных в честь соответствующих идентификаторов (исключая цепочки), так как новый файл содержит

>4S3O_2:С
GSMSQAVQTNGTQPLSKTWELSLYELQRTPQEAITDGLEIVVSPRSLHSELMCPICLDMLKNTMTTKECLHRFCADCIITALRSGNKECPTCRKKLVSKRSLRPDPNFDALISKIYPS

и это называется 4С30_2.фаста

Вот что я пробовал:

awk -F ">" | sed -i -e '$0,$1{w file.fasta d}' BlindSet150.fasta 
Рейтинг:2
флаг hr

Вероятно, существует надежный инструмент биоинформатики для извлечения последовательностей fasta в отдельные файлы, но если вы хотите свернуть свои собственные с помощью awk, я бы предложил что-то вроде

awk -F '[>:]' '/^>/ {close(f); f = $2 ".fasta" } f {print > f}' BlindSet150.fasta

Ответить или комментировать

Большинство людей не понимают, что склонность к познанию нового открывает путь к обучению и улучшает межличностные связи. В исследованиях Элисон, например, хотя люди могли точно вспомнить, сколько вопросов было задано в их разговорах, они не чувствовали интуитивно связи между вопросами и симпатиями. В четырех исследованиях, в которых участники сами участвовали в разговорах или читали стенограммы чужих разговоров, люди, как правило, не осознавали, что задаваемый вопрос повлияет — или повлиял — на уровень дружбы между собеседниками.