Features of influenza virus hemagglutinin genes and their recoding possibilities

Cover Page


Cite item

Full Text

Abstract

The world has already entered the stage of increasing odds for a new pandemic, which prompts to seek out for new flu vaccines, because existing vaccines demonstrate only suboptimal effectiveness. With the Covid-19 pandemic, the possibility of using mRNA vaccines has been opened up, and a prospect of finding hemagglutinin (HA) gene mRNA-based new influenza vaccines seems very attractive. As a rule, the mRNA vaccine is a product of recoding, which ensures the mRNA stability. However, the results of mRNA recoding can be ambiguous. The purpose of this report is to analyze the features of genes and proteins and to consider opportunities and limitations in their recoding. Primary structures of NA proteins and relevant genes were retrieved from Internet publicly available databases. The amino acid composition and frequency of dipeptides, nucleotide and dinucleotide compositions, %GC, translational code and compositions of neighboring di- and tricodones, distribution along primary structure for explicit and synonymous mutations were determined. H1N1 and H3N2 subtypes have both specific and general features (limitations) in their genes, differing not only in the number of protein substitutions, but also in the number and distribution of gene synonymous codons, which do not manifest in the protein primary structure, but appear, apparently, as a hidden factor, which causes the low effectiveness of classical influenza vaccines. The identification of several limitations in gene structure suggests that its any modification (in any gene) must not contradict each of the restrictions established by nature. The frequency of CpG dinucleotides in all studied strains is low, but a potential for optimizing it in H1N1 strains due to the prohibition of the quartet in the gene for arginine-encoding codons is especially limited and can be implemented through synonymous codons of other amino acids (alanine, proline, threonine or serine). Compared to the H1N1 subtype, the H3N2 subtype can be expected to have more possibilities in constructing stable NA gene mRNA.

Full Text

Введение

Пандемии гриппа возникают с интервалом 10–40 лет, и с 2020 года мир уже вступил в стадию возрастания вероятности возникновения новой пандеми, что побуждает к поиску против нее новых вакцин. Призыв к переосмысливанию подходов к разработке вакцин против вирусов, вызывающих респираторные инфекции, представляется своевременным, поскольку эффективность существующих к ним вакцин лишь субоптимальная [11].

Стремительно развивающаяся синтетическая биология открыла возможности быстрого конструирования новых генов и их продуктов [12]. С пандемией Covid-19 прояснилась перспектива использования для иммунизации мРНК-вакцин [3, 7]. В распространении вирусов гриппа и в формировании популяционного иммунитета к ним роль гемагглютинина (НА) является определяющей. Можно предположить, что применительно к гриппу мРНК-вакцины на основе НА могут иметь превосходство над классическими вакцинами прежде всего в том, что мРНК-вакцина как носитель информации о вирусе позволяет избавиться от антигенного груза других белков вируса, не вовлеченных в формирование иммунитета к нему, ограничивая ее состав (в минимальном варианте) 4 молекулами мРНК НА, представляющими 4 разных подтипа вирусов гриппа, рекомендуемых ВОЗ для изготовления классических вакцин из цельных вирионов. В этом аспекте перспектива поиск новых противогриппозных вакцин на основе мРНК НА представляется весьма рациональной.

Как правило, мРНК-вакцина является продуктом рекодирования отдельного гена либо генома, например вируса, подвергнутого разным модификациям, обеспечивающим стабильность мРНК [9, 10, 13, 14]. Ныне признано, что мРНК не только задает первичную структуру белка, но и содержит в себе регуляторный код. О наличии последнего свидетельствуют возможности изменения синонимическими мутациями стабильности мРНК и ее вторичной структуры, эффективности трансляции, локализации и сплайсинга мРНК и котрансляционного свертывания белка [6, 8].

Успех в новом поиске противогриппозных вакцин на основе мРНК НА определяется прежде всего знанием особенностей кодирования ген НА и допустимыми возможностями его рекодирования. Цель данного сообщения — проанализировать особенности генов НА и рассмотреть возможности и ограничения их рекодирования.

Материалы и методы

Для сравнительного компьютерного анализа были использованы пандемические штаммы H1N1 A/Brevig Mission/1/18, H1N1 A/California/08/2009, H2N2 A/Japan/305/1957 и H3N2 A/Aichi/2/1968 и произвольно выбранные циркулирующие в эпидсезоне 2023–2024 гг. штаммы H1N1 A/New_Jersey/56/2023 и H1N1 A/Berlin/34/2023. Источником первичных структур НА и их генов служили обще доступные в Интернете базы данных (http://www.ncbi.nlm.nih.gov, http://platform.gisaid.org, http://viralzone.expasy.org).

52 гена белков человека, разных как по длине, так и по функциям (от гистона Н4 до титина) были использованы для выявление редких дикодонов в первичных структурах генов. Их общая длина составила болеее 300 000 нуклеотидов. Источником первичных структур генов и белков служила общедоступная в Интернете база данных (http://www.nextprot.org). В них определяли аминокислотный состав и частоту дипептидов, нуклеотидный и динуклеотидный составы, %GС, трансляционный код и составы соседствующих ди- и трикодонов, распределение по первичной структуре НА явных и синонимических мутаций

Для выявления ограничений в кодировании генов были построены также линейные последовательности оцифрованных трикодонов, считанных (имитируя процесс трансляции на рибосомах) со сдвигом рамки на один кодон [2]. Их числовым показателем служил индекс комплементарности (ИК) — сумма водородных связей, которые способны образовывать составляющие их кодоны с тРНК. ИК отдельных кодонов приведены в таблице генетического кода (рис. 1). Были подсчитаны частоты встречаемости разницы между ИК соседствующих трикодонов/кодонов для каждого гена (табл.).

 

Таблица. Различия трикодонов, считываемых со сдвигом на один шаг, по их ИК

Table. Differences of tricodons, read with a shift of one step, according to their complementarity indices

Источник гена гемагглютинина вирусов гриппа

A source of the hemagglutinin gene of influenza viruses

%GC гена

%GC of the gene

Длина гена в кодонах

The length of the gene in codons

Частота встречаемости разницы последовательных трикодонов по ИК

Frequency of occurrence of the difference of successive tricodons in CI

Значения разницы

Difference values

0

1

2

3

HA H1N1 A/Brevig Mission/1/1918

42

566

186

279

105

10

HA H2N2 A/JAPAN/305/1957

42

562

187

280

98

11

HA H3N2 A/AICHI/2/1968

45

566

223

243

105

9

HA H1N1 A/California/04/2009

41

566

207

267

94

12

 

Рисунок 1. Таблица генетического кода с приведенными значениями индексов комплементарности кодонов

 

В статье используется международный код аминокислот: A — аланин, C — цистеин, D — аспарагиновая кислота, E — глутаминовая кислота, F — фенилаланин, G — глицин, H — гистидин, I — изолейцин, K — лизин, L — лейцин, M — метионин, N — аспарагин, P — пролин, Q — глутамин, R — аргинин, S — серин, T — треонин, V — валин, W — триптофан, Y — тирозин. Для обозначения нуклеиновых оснований используется следующая аббревиатура: А — аденин, G — гуанин, C — цитозин, Т — тимин.

Результаты

Чаще всего при рекодировании вирусов или их генов применяют оптимизацию и деоптимизацию частот кодонов и их пар и динуклеотидов СрG и UpA, модификации нуклеотидов [6, 10]. Поиски противогриппозных вакцин до последнего времени не учитывали роль синонимических мутаций в гене НА. Поэтому в этом разделе приводятся данные расширенного анализа, используемые при рекодировании генов.

Специфика кодирования генов НА у вирусов гриппа разных подтипов проявляется прежде всего по их составу динуклеотидов. На рис. 2 представлены данные по их частотам у штаммов, вызвавших 4 последние пандемии гриппа.

 

Рисунок 2. Состав динуклеотидов в генах НА пандемических штаммов вирусов гриппа

 

Их выраженные различия практически по всем динуклеотидам предполагают применение разных подходов модификации их мРНК при рекодировании с целью использования в качестве противогриппозных вакцин

Следующим важным источником информации об особенностях кодирования генов НА служит его трансляционный код, позволяющий выявить уровень использования разных синонимических кодонов (СК), и он оказывается особенным у вирусов подтипа H1N1 тем, что из него исключен квартет кодонов CGC, CGT, CGA и CGG, кодирующих аргинин. Последний кодируются в НА лишь двумя оставшимися кодонами АGА и АGG. Примечательно, что этот запрет на квартет кодонов аргинина в гене НА сохраняется, по крайней мере, с 1918 г. и не распространяется на другие белки вируса подтипа H1N1, а в гене НА вирусов подтипа H3N2 у разных штаммов не используется лишь 1 или 2 кодона из упомянутого квартета кодонов аргинина, чаще всего кодоны CGC и CGT (рис. 3).

 

Рисунок 3. Таблица трансляционного кода НА штаммов H1N1 A/Brevig Mission/1/1918 и A/California/04/2009

 

Хотя по использованию СК гены НА A/Brevig Mission/1/18 и A/California/08/2009 существенно отличаются, общим для них является наиболее редкое использование кодонов, содержащих преимущественно G и C, и наиболее высокая частота (для большинства аминокислот) кодонов, содержащих А и Т, что обусловливает низкое значение %GC в генах НА — 41–42%. Расширяет и уточняет описание особенностей кодирования генов встречаемость в них дикодонов. Из-за различий в использовании СК каждому штамму вируса одного подтипа (даже при идентичности первичной структуры белка НА) свойственна своя картина дикодонов. В качестве иллюстрации наличия ограничений в кодировании генов НА на рис. 4 представлена встречаемость дикодонов в гене НА пандемического штамма HA H1N1 A/Brevig Mission/1/1918. Заметим, что при наличии 61 смыслового кодона в генетическом коде минимальная длина гена белка, которая могла бы охватывать хотя бы по одному разу соседствование всех кодонов в дикодонах, должна составлять 3721 кодон. Длина же гена НА составляет всего 564 кодона, поэтому большинство возможных дикодонов на рис. 4 отсутствуют. Рис. 4 позволяет уточнить численность и состав дикодонов (а также и дипептидов) по первой или второй позициям. Из 564 возможных разных дикодонов для гена НА использованными оказались лишь 490 дикодонов, и из них 426 встречаются только один раз, что свидетельствует, с одной стороны, об ограничениях (уникальности) в соседствовании кодонов и, с другой стороны, о предпочтении у значительно меньшего числа кодонов находиться в соседстве с одним и тем же кодоном для одних и тех же дипептидов. Повторяемость дикодонов не более 3.

 

Рисунок 4. Встречаемость дикодонов и дипептидов в НА A/Brevig Mission/1/1918 H1N1. Примечание. Первый вертикальный ряд и первый горизонтальный ряд сверху — обозначения аминокислот; второй вертикальный ряд и второй горизонтальный ряд сверху — нумерация кодонов; третий вертикальный ряд — кодоны.

 

Для выяснения, используются ли в генах НА редкие дикодоны, приняв за последние те, что редко встречаются в генах человека, был первоначально выполнен поиск редко встречающихся дикодонов в генах человека. Выявлены 2 их группы (рис. 5). Одна их них включает очень редко встречающие дикодоны. Другая охватывает дикодоны, которые отсутствовали в исследованных генах человека. Ни один из дикодонов обеих групп не был выявлен в исследованных генах НА вирусов гриппа.

 

Рисунок 5. Список редко встречающихся (А) и не обнаруженных (Б) в исследованных генах человека дикодонов

 

В природе НА вирусов гриппа относятся к числу наиболее изменчивых, поэтому проведен анализ первичной структуры их генов на существование ограничений в их кодировании. Оцифровка кодонов обозначила возможность разделения таблицы генетического кода (рис. 1) на четыре квадрата и соответственно выделить три группы триплетов по значениям их ИК. Первая группа, включающая триплеты, кодирующие пролин, аланин, аргинин и глицин, характеризуется наибольшими (8 и 9) значениями их ИК, и составленные из них трикодоны имеют максимальное значение ИК — 27. Тирозин, фенилаланин, лейцин (кодоны ТТА и ТTG), изолейцин, метионин, аспарагин и лизин составляют вторую группу кодонов с ИК, равными 6 или 7. Трикодоны из них могут иметь минимальное значение ИК — 18. Кодоны остальных аминокислот имеют промежуточные значения ИК — 7 или 8. Поскольку считывание кодонов проводится со сдвигом рамки на один кодон, то разница между ИК соседствующих трикодонов может принимать значения от 0 до 3. На рис. 6 представлена в качестве иллюстрации линейная последовательность ИК трикодонов гена НА штамма H1N1 A/Brevig Mission/1/1918, считанных со сдвигом рамки на один кодон, имитируя процесс трансляции на рибосомах.

 

Рисунок 6. Последовательность значений индексов комплементарности трикодонов HA штамма H1N1 A/Brevig Mission/1/1918 при сдвиге рамки считывания на 1 кодон

 

Как уже отмечалось в разделе «Материалы и методы», при каждом сдвиге считывания трикодонов заменяется лишь один триплет и максимальная разница между ИК соседних трикокодонов будет равна 3. У гена НА штамма H1N1 A/Brevig Mission/1/1918 максимальное и минимальное значения ИК составляют соответственно 25 и 19. Лишь у 10 соседствующих пар трикодонов (табл.) ИК имеют разницу 3, а у остальных она не более 2, то есть кодирование гена НА штамма H1N1 A/Brevig Mission/1/1918 имеет явные ограничения. Об общности (универсальности) этих ограничений свидететельствуют приведенные в табл. показатели разниц ИК трикодонов и генов НА других пандемических штаммов. У генов НА пандемических штаммов вирусов гриппа не более 2,1% соседствующих пар трикодонов (табл.) ИК имеют разницу 3, а разницу по ИК 0 или 1 имеют 82–84% соседствующих трикодонов, то есть даже разница между ИК, равной 2, в генах НА не предпочтительна. Следует специально оговорить, что при свойственной ГК композиции выявленные общие ограничения в кодировании генов, благодаря вырожденности генетического кода, не ведут к запретам соседствования аминокислот в первичной структуре белков.

В качестве иллюстрации, что каждый штамм вирусов гриппа уникален хотя бы по распределению в его НА гене СК, для сравнения были выбраны две пары штаммов. Одна из них включает пандемические штаммы A/Brevig Mission/1/1918 и A/California/04/2009, разделенные по времени возникновения более чем в 90 лет, другая пара — два штамма подтипа H1N1, выделенные в ноябре 2023 г. Сравнение первичных структур белков и генов пандемических штаммов 1918 г. и 2009 г. выявил, что белки НА A/California/04/2009 отличается от НА A/South Carolina/1/1918 по 79 позициям, которым сопутствуют различия по 191 СК. На рис. 7 представлен фрагмент последовательностей белков и генов НА обоих штаммов со специальной пометкой (*) позиций, различающихся по СК. Очень примечательна весьма частая сблоченность последних и чередование их с мутациями, вызвавшими замены аминокислот. Два штамма H1N1 эпидсезона 2023/2024 гг. естественно имели более скромные различия их первичных структур белков НА (всего по 14 позициям) и более высокий показатель, как и в случае НА пандемических штаммов, по СК их генов — 21. Столь высокое преобладание синонимических замен и особенности их локализации возможно связаны с «выравниванием» разницы по ИК между соседствующими кодонами, позволяющим закрепиться в структуре гена тем мутациям, что привели к замещениям аминокислот.

 

Рисунок 7. Различия первичных структур фрагмента НА пандемических штаммов A/Brevig Mission/1/1918 и A/California/04/2009

 

Обсуждение

Данные выполненного нами анализа свидетельствуют о наличии у генов НА вирусов гриппа разных подтипов как частных, так и общих особенностей (ограничений), которые необходимо учитывать при их рекодировании, имея в виду, что и штаммы одного подтипа в пределах эпидсезона могут иметь различия НА не только по числу замен в самом белке, которые могут затрагивать до 30–40 позиций, но и еще большие различия по числу и распределению СК в гене, не проявляющиеся в первичной структуре самого белка НА и выступающие, по-видимому, как скрытый фактор, обусловливающий низкую эффективность классических противогриппозных вакцин.

По динуклеотидам различия между генами НА выражены не только между подтипами, но и для штаммов одного и того же подтипа, выделенных в разное время. При рекодировании оптимизация и деоптимизация частот динуклеотидов по СрG и UpA проводится посредством введения в ген СК [6, 10]. Частота СрG у всех исследованных штаммов самая низкая, но возможность оптимизации ее у штаммов H1N1 из-за запрета квартета кодонов, кодирующих аргинин, ограничена и может быть реализована через СК других аминокислот (аланина, пролина, треонина или серина).

Следует сразу оговорить, что оптимизация частот динуклеотидов через СК должна быть подчинена соблюдению ограничения, накладываемого значениями разности ИК между соседствующими трикодонами, учитывая очень низкую частоту встречаемости разности, равной 3. Поясним это на конкретном примере — на фрагменте последовательности НА H1N1 A/Brevig Mission/1/18, представленного на рис. 8. Выберем в качестве мишени для оптимизации частоты динуклеотида СрG кодон АСА, кодирующий треонин и находяшийся в третьей позиции выделенного серым цветом трикодона, и заменим его синонимическим триплетом АСG, имеющим значение ИК, равное 8 (см. рис. 1). В результате такой замены выделенный серым цветом трикодон превратится в трикодон GCA GAC ACG и с его ИК, равным 24, разница между соседними трикодонами, будет равна 3. Последняя очень редко встречается между соседними трикодонами в НА вирусов гриппа. Ее частота, варьруя у НА в диапазоне 1,6–2,1%, на 1% ниже чем у генов человека, то есть возможности модуляции частоты СрG при рекодировании, используемой, как правило, с целью стабилизации мРНК, у гена H1 НА, по сравнению с Н3 НА, весьма ограничены.

 

Рисунок 8. Иллюстрация рассчета индексов комплементарности трикодонов, считываемых сдвигом на 1 кодон. Примечание. 1-й ряд букв — последовательность аминокислот, 2-й ряд — обозначения кодонов, 3-й ряд — обозначения индексов комплементарности кодонов, 4-й ряд — обозначения индексов комплементарности трикодонов.

 

По использованной нами модели считывания триплетов в мРНК каждый кодон, за исключением первых и последних трех кодонов, включается, как и при трансляции мРНК на рибосомах, в три последовательно считываемые трикодона, и очевидно, что ИК каждого кодона в трикодоне связан с ИК двух предшествующих и двух последующих кодонов. Это подводит к признанию существования в генах континуума связности кодонов по значениям их ИК и ограничения на их мутагенез. Свидетельством связности кодонов служит иллюстрируемая на рис. 7, на примере генов НА штаммов A/Brevig Mission/1/18 и A/California/04/2009, высокая частота и линейное распределение СК между теми кодонами, с которыми связана замена аминокислот. Как метко подмечено Комаром А.А., «синонимические кодоны размещены в мРНК стратегически (в определенных местах) таким образом, что они задают специфическую кинетику трансляции, обеспечивающую, в свою очередь, эффективное поэтапное котрансляционное сворачивание белка», то есть являются вторичным кодом для сворачивания белка [8].

У штаммов вируса гриппа одного и того же подтипа, как отмечалось выше, и эпидсезона различия НА связаны не только с заменами аминокислот, но и с еще большим различием в числе и распределении СК. Последние служат причиной образования у каждого штамма вируса гриппа своего конформера НА и своей мозаики обнажения и доступности в нем эпитопов. Социркуляция в эпидсезоне штаммов вируса гриппа с разными первичными структурами НА и составами СК в их генах и отличие от них по этим же показателям вакцинного щтамма являются (следует признать) другим фактором, обрекающим противогриппозные вакцины любой конструкции на невысокую эффективность. В США, например, эффективность вакцины против гриппа на субоптимальном уровне — 14–60%, а иммунитет к гриппу сохраняется лишь несколько месяцев [11].

Если таблица трансляционного кода (рис. 3) служит обобщающей информацией об использовании СК в мРНК, то двумерная комбинированная таблица (рис. 4) служит источником информации по дипептидам в белке НА и соответствующим им дикодонам в мРНК и полезна особенно тем, что в ней видно, какие СК сочетаются (или не сочетаются) друг с другом и как часто. Избирательность в соседствовании между кодонами служит, наряду с ограничениями в разнице по ИК между соседними кодонами, вторым барьером, который нужно обходить при рекодирования генов. Третьим же барьером являются редко встречающиеся и не обнаруженные в исследованных нами генах человека дикодоны, перечисленные на рис. 5. Эти дикодоны можно рассматривать как запретные для использования при рекодировании.

Учет перечисленных нами барьеров в рекодировании генома/гена посредством изменения состава СК переводит синтетическую биологию на другой уровень, способствуя избегания неудач. Ведь известно, что результаты рекодирования мРНК неоднозначны и могут привести к ухудшению свойств у новых вариантов синтетических геномов или генов. Более того, введенные в геном вируса синонимические замены могут реверсироваться к кодонам диких штаммов [6, 10], что можно рассматривать как существование ограничений в их рекодировании и подтверждение реальности выявленных нами барьеров, которые нельзя игнорировать, модифицируя гены или вирусы.

Нельзя обойти вниманием избирательность и неизменный консерватизм при исключении из гена Н1 НА квартета кодонов, кодирующих аргинин. Если вновь обратиться к списку редко встречающихся и не обнаруженных в исследованных нами генах человека дикодонов (рис. 5), то нетрудно заметить, что в нем преобладают, с одной стороны, кодоны аминокислот (серин, лейцин и аргинин), кодируемых 6 кодонами, а с другой стороны, кодоны с динуклеотидом СрG, что побуждает объяснить исключение квартета кодонов CGC, CGT, CGA и CGG из гена Н1 НА как проявление общего запрета по дикодонам. Однако эта аргументация отметается ограниченностью исключения только генами Н1 НА и не распространением ее на другие гены вирусов гриппа подтипа H1N1 и на другие подтипы вирусов гриппа.

Приемлемым объяснением исключения квартета кодонов CGC, CGT, CGA и CGG из гена Н1 НА может быть связано с особенностями структуры самого белка НА, в частности ограничениями в его инвариантной последовательности. Так, следствием запрета в трансляционном коде гена Н1 НА на кодоны CGC, CGT, CGA и CGG будут соответственно ограничения на замены по 8 аминокислотам (см. рис. 3): глицину, триптофану, цистеину, серину (в случае кодирования его кодонами с корнем АG), пролину, лейцину (в случае кодирования его кодонами с корнем CT), гистидину и глутамину. Ограничения на цистеин, триптофан, глицин и лейцин связаны с присутствием их в инвариантных позициях первичной структуры белка Н1, и запрет на использование в коде гена Н1 всего квартета триплетов аргинина с корнем CG пресекает возможности мутирования кодонов этих аминокислот

Выявление скрытой роли СК в невысокой эффективности противогриппозных вакцин еще более убеждает в том, что возможность успешного использования принципа «один иммуноген для всех штаммов подтипа вируса» маловероятна. Один из путей решения проблемы с увеличением эффективности противогриппозных вакцин применительно к мРНК вакцин мог бы заключаться в привлечении против штаммов одного подтипа 2–3 иммуногенов, то есть 2–3 мРНК, охватывающих более широкий спектр циркулирующих в эпидссезоне штаммов соответствующего подтипа, опираясь на представление о доминантных штаммах подтипа, упоминаемых в планах США и ВОЗ по поиску универсальных противогриппозных вакцин [4, 5]. Конструирование соответствующих им мРНК могло бы основываться на том же принципе (но более расширенном), что был предложен нами ранее для построения доминантной белковой структуры НА одного или нескольких эпидсезонов, в зависимости от целевой установки [1].

Приведем с помощью рис. 9 краткое изложение процедуры построения фрагмента аминокислотной последовательности доминантного Н3 НА эпидсезона 2018–2019 гг., которая легко трансформируется в доминантную мРНК заменой аминокислот соответствующими кодонами. На рис. 9 первый вертикальный числовой ряд — нумерация позиций аминокислот в НА, второй вертикальный ряд аминокислот — собственно сама построенная доминантная последовательность НА эпидсезона, параллельно ей, правее — «скелет» молекулы с расположением инвариантных (представлены обозначениями аминокислот) и вариабельных (представлены точками) сайтов. За последними следует горизонтальный ряд всех замещающих аминокислот, обнаруженных в этих позициях НА у разных штаммов эпидсезона, с указанием (в скобках) для каждой аминокислоты частоты ее встречаемости. Строилась доминантная последовательность НА вставлением в цепь с инвариантными блоками доминантной аминокислоты из приводимого горизонтального ряда заменяемых аминокислот [1].

 

Рисунок 9. Фрагмент доминирующей последовательности гемагглютинина для штаммов Н3N2 эпидсезона 2018–2019 гг.

 

Как следует из рис. 9, доминантная последовательность НА не охватывает все циркулирующие штаммы, и нередки ситуации (например, позиции 147 и 151), когда в соответствующей позиции доминантная аминокислота по численности не намного превосходит другую аминокислоту в этой же вариабельной позиции. Последнюю условно можно назвать как субдоминантную. Поэтапно можно построить несколько субдоминантных НА, замещая каждую варибельную позицию инвариантной последовательности НА новыми уменьшающими по частоте встречаемости аминокислотами. В совокупности с доминантной последовательностью НА они обеспечивают более широкий охват НА штаммов соответствующего подтипа. В отличие от мРНК вакцин, использование описанного подхода применительно к классическим вакцинам из вирионов сопряжено с возрастанием антигенной нагрузки вакцины за счет белков вирусов, не вовлеченных в формирование к ним иммунитета.

Завершая обсуждение результатов биоинформационного анализа первичной структуры генов НА вирусов гриппа хотелось бы подчеркнуть полезность его в выявлении тех их особенностей, которые потенциально могли бы ограничивать успешность их рекодирования с целью получения на их основе мРНК вакцины. Выявление нескольких ограничений в структуре генов предполагает, что любая ее модицикация (в любом гене) должна не противоречить каждому из ограничений, установленных природой. Сравнивая НА подтипов H1N1 и H3N2, можно предвидеть больше возможностей в конструировании стабильной мРНК у подтипа H3N2 из-за исключения из трансляционного кода у гена подтипа H1N1 квартета кодонов, кодирующих аргинин.

×

About the authors

Eugene P. Kharchenko

Sechenov Institute of Evolutionary Physiology and Biochemistry of the Russian Academy of Sciences

Author for correspondence.
Email: neuro.children@mail.ru

DSc (Biology), Senior Researcher

Россия, St. Petersburg

References

  1. Харченко Е.П. Поиски универсальной противогриппозной вакцины: возможности и ограничения // Эпидемиология и вакцинопрофилактика. 2019. Т. 18, № 5. C. 70–84. [Kharchenko E.P. The search for a universal influenza vaccine: possibilities and limitations. Epidemiologiya i vaktsinoprofilaktika = Epidemiology and Vaccine Prevention, 2019, vol. 18, no. 5, pp. 70–84. (In Russ.)] doi: 10.31631/2073-3046-2019-18-5-70-84
  2. Харченко Е.П. Проблемы и коллизии вакцинологии // Эпидемиология и вакцинопрофилактика. 2023. Т. 22, № 6. С. 183–200. [Kharchenko E.P. Problems and Collisions of Vaccinology. Epidemiologiya i vaktsinoprofilaktika = Epidemiology and Vaccine Prevention, 2023, vol. 22, no. 6, pp. 183–200. (In Russ.)] doi: 10.31631/2073-3046-2023-22-6-183-200
  3. Altmann D.M., Boyton R.J. COVID-19 vaccination: the road ahead. Science., 2022, vol. 375, no. 6585, pp. 1127–1132. doi: 10.1126/science.abn1755
  4. Erbelding E.J., Post D.J., Stemmy E.J., Roberts P.C., Augustine A.D., Ferguson S., Paules C.I., Graham B.S., Fauci A.S. A universal influenza vaccine: the strategic plan for the National Institute of Allergy and Infectious Diseases. J. Infect. Dis., 2018, vol. 218, no. 3, pp. 347–354. doi: 10.1093/infdis/jiy103
  5. Global influenza strategy 2019–2030. World Health Organization. URL: https://www.who.int/publications/i/item/978924151532015
  6. Gonçalves-Carneiro D., Bieniasz P.D. Mechanisms of attenuation by genetic recoding of viruses. mBio, 2021, vol. 12, no. 1: e02238-20. doi: 10.1128/mBio.02238-20
  7. Knyazev S., Chhugani K., Sarwal V., Ayyala R., Singh H., Karthikeyan S., Deshpande D., Baykal P.I., Comarova Z., Lu A., Porozov Y., Vasylyeva T.I., Wertheim J.O., Tierney B.T., Chiu C.Y., Sun R., Wu A., Abedalthagafi M.S., Pak V.M., Nagaraj S.H., Smith A.L., Skums P., Pasaniuc B., Komissarov A., Mason C.E., Bortz E., Lemey P., Kondrashov F., Beerenwinkel N., Lam T.T., Wu N.C., Zelikovsky A., Knight R., Crandall K.A., Mangul S. Unlocking capacities of genomics for the COVID-19 response and future pandemics. Nat. Methods, 2022, vol. 19, no. 4, pp. 374–380. doi: 10.1038/s41592-022-01444-z
  8. Komar A.A. [Synonymous codon usage — a guide for co-translational protein folding in the cell]. Mol. Biol. (Mosk.), 2019, vol. 53, no. 6, pp. 883–898. doi: 10.1134/S0026898419060090
  9. Lin B.C., Kaissarian N.M., Kimchi-Sarfaty C. Implementing computational methods in tandem with synonymous gene recoding for therapeutic development. Trends Pharmacol. Sci., 2023, vol. 44, no. 2, pp. 73–84. doi: 10.1016/j.tips.2022.09.008
  10. Martínez M.A., Jordan-Paiz A., Franco S., Nevot M. Synonymous virus genome recoding as a tool to impact viral fitness. Trends Microbiol., 2016, vol. 24, no. 2, pp. 134–147. doi: 10.1016/j.tim.2015.11.002
  11. Morens D.M., Taubenberger J.K., Fauci A.S. Rethinking next-generation vaccines for coronaviruses, influenzaviruses, and other respiratory viruses. Cell. Host Microbe, 2023, vol. 31, no. 1, pp. 146–157. doi: 10.1016/j.chom.2022.11.016
  12. Ostrov N., Nyerges A., Chiappino-Pepe A., Rudolph A., Baas-Thomas M., Church G.M. Synthetic genomes with altered genetic codes. Curr. Opin. Syst. Biol., 2020, vol. 24, pp. 32–40. doi: 10.1016/j.coisb.2020.09.007
  13. Tian Y., Deng Z., Yang P. mRNA vaccines: A novel weapon to control infectious diseases. Front. Microbiol., 2022, no. 13: 1008684. doi: 10.3389/fmicb.2022.1008684
  14. Yang L., Tang L., Zhang M., Liu C. Recent advances in the molecular design and delivery technology of mRNA for vaccination against infectious diseases. Front. Immunol., 2022, no. 13: 896958. doi: 10.3389/fimmu.2022.896958

Supplementary files

Supplementary Files
Action
1. JATS XML
2. Figure 1. Table of the genetic code with the given values of the codon complementarity indiсes

Download (441KB)
3. Figure 2. The composition of dinucleotides in the genes of pandemic strains of influenza viruses

Download (305KB)
4. Figure 3. Translation code table for H1N1 strains A/Brevig Mission/1/1918 and A/California/04/2009

Download (722KB)
5. Figure 4. The occurrence of dicodones and dipeptides in A/Brevig Mission/1/1918 H1N1. Note. The first vertical row and the first horizontal row from above are amino acid designations; the second vertical row and the second horizontal row from above are codon numbering; the third vertical row are codons.

Download (1MB)
6. Figure 5. List of rare (A) and undetected (B) dicodons in the studied human genes

Download (828KB)
7. Figure 6. The sequence of values of the tricodon complementarity indiсеs of the H1N1 A/Brevig Mission/1/1918 НА gene when the reading frame is shifted by 1 codon

Download (1MB)
8. Figure 7. Differences in the primary structures of the HA fragment in the pandemic strains A/Brevig Mission/1/1918 and A/California/04/2009

Download (812KB)
9. Figure 8. An illustration of the calculation of a complementarity index in tricodons read by a shift of one codon. Note. The 1st row of letters is a sequence of amino acids, the 2nd row — a designation of codons, the 3rd row — a designation of codon complementarity indices, the 4th row — a designation of tricodon complementarity indices.

Download (129KB)
10. Figure 9. Fragment of the dominant hemagglutinin sequence for H3N2 strains of the epidemic seasons 2018–2019

Download (239KB)

Copyright (c) 2024 Kharchenko E.P.

Creative Commons License
This work is licensed under a Creative Commons Attribution 4.0 International License.

СМИ зарегистрировано Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций (Роскомнадзор).
Регистрационный номер и дата принятия решения о регистрации СМИ: серия ПИ № ФС 77 - 64788 от 02.02.2016.


This website uses cookies

You consent to our cookies if you continue to use our website.

About Cookies