У меня есть несколько файлов .fasta (с именем barcode*_consensus.fasta), которые выглядят так:
>|>consensus_cl_id_1018_total_supporting_reads_12 LN:i:1369 RC:i:12 XC:f:1.000000
TCATTAACCAAAAGTGGTGAGCGTTCTCCCGAAGGTTAAACTACCCACTTCTTTTGCAGCCAACTCCCATGGTGTGACGGG
|>consensus_cl_id_107_total_supporting_reads_6 LN:i:1440 RC:i:6 XC:f:1.000000
GACTTCAGCCCAGTCATTAGTCCTACCATGGACCCCATATTACTAGAGGAGCTTCCGATATTACTAACTCCCATGCCGTGACGGGCG
|>consensus_cl_id_116_total_supporting_reads_5 LN:i:1314 RC:i:558 XC:f:1.000000
AGAACGAACGCTGGCGGCAGGCCTAACACATGCAAGTCGAGCGCTACCTTCGGGGGAGCGGCGGACGGGTTAGTAACGCGTGGGAATAT
Я хотел бы дублировать/повторять каждые две строки n раз, как указано после «общего числа поддерживаемых чтений». Так, например, я хотел бы продублировать первые две строки 12 раз, вторые две строки 6 раз и т. д.
С awk мне удалось выбрать каждую строку, начинающуюся с «>», и следующую строку:
awk '/>/{nr[NR]; nr[NR+1]} NR в nr' barcode01_consensus.fasta
Но я не могу понять, как напечатать это n раз с переменной.
Буду признателен за любую оказанную помощь.
Обновлено:
Поэтому я хотел бы, чтобы окончательный файл выглядел примерно так:
|>consensus_cl_id_1018_total_supporting_reads_12 LN:i:1369 RC:i:12 XC:f:1.000000
TCATTAACCAAAAGTGGTGAGCGTTCTCCCGAAGGTTAAACTACCCACTTCTTTT
|>consensus_cl_id_1018_total_supporting_reads_12 LN:i:1369 RC:i:12 XC:f:1.000000
TCATTAACCAAAAGTGGTGAGCGTTCTCCCGAAGGTTAAACTACCCACTTCTTTT
|>consensus_cl_id_1018_total_supporting_reads_12 LN:i:1369 RC:i:12 XC:f:1.000000
TCATTAACCAAAAGTGGTGAGCGTTCTCCCGAAGGTTAAACTACCCACTTCTTTT
....x 12 раз....