Є ще 142 сторінки.

Дивитися все сторінки або завантажити PDF файл.

Формула / Реферат

1. Білок з цинковими пальцями, який містить не-C2H2 цинковий палець, де вказаний цинковий палець має спіральну частину, залучену до зв'язування ДНК, і де щонайменше один цинковий палець містить послідовність Cys-(XA)2-4-Cys-(XB)12-His-(XC)3-5-Cys-(XD)1-10 (SEQ ID NO: 3), де XA, XB, XC і XD можуть означати будь-яку амінокислоту, і де

(i) (XD)1-10 містить амінокислотну послідовність, вибрану з групи, яка складається з QKP, QLV і залишку G, який безпосередньо прилягає з C-кінця до C-кінцевого залишку Cys;

(ii) якщо (XD)1-10 містить амінокислотну послідовність QKP і (XC)3-5 складається з 3 амінокислот, залишки (XC)3 вибрані з групи, що складається з IRT, IRR, TKI і AQR.

2. Білок з цинковими пальцями за п. 1, який містить будь-яку з послідовностей, показаних у будь-якій з таблиць 1, 2, 3 і 4.

3. Білок з цинковими пальцями за п. 1, у якому XD містить послідовність QLV, QKP, G, GG або GGG.

4. Білок з цинковими пальцями за будь-яким з пп. 1-3, у якому білок з цинковими пальцями містить будь-яку з послідовностей, показаних у таблиці 8, і сконструйований для зв'язування з послідовністю-мішенню в гені IPP2-K.

5. Злитий білок, який містить білок з цинковими пальцями за будь-яким з пп. 1-4 і один або більше функціональних доменів.

6. Злитий білок за п. 5, де функціональний(ні) домен(и) містить(ять) напівдомен розщеплення, і, додатково, де вказаний злитий білок містить лінкер ZC, розташований між напівдоменом розщеплення і білком з цинковими пальцями.

7. Злитий білок за п. 6, у якому довжина лінкера ZC складає 5 або 6 амінокислот.

8. Полінуклеотид, який кодує білок з цинковими пальцями за будь-яким з пп. 1-4.

9. Полінуклеотид, який кодує злитий білок за будь-яким з пп. 5-7.

10. Рослинна клітина, яка містить білок з цинковими пальцями за будь-яким з пп. 1-4, злитий білок за будь-яким з пп. 5-7 або полінуклеотид за п. 8 або 9.

11. Рослинна клітина за п. 10, де клітина являє собою клітину насінини.

12. Рослинна клітина за п. 10 або 11, в якій IPP2-K частково або повністю інактивований, а рівні фітинової кислоти в насінині знижені.

13. Спосіб спрямованого розщеплення клітинного хроматину в рослинній клітині, причому спосіб включає експресію в клітині пари злитих білків за п. 6 або щонайменше одного полінуклеотиду, який кодує вказану пару злитих білків; де

(a) послідовності, що є мішенями для злитих білків, знаходяться в межах десяти нуклеотидів одна від одної; і

(b) злиті білки димеризуються і розщеплюють ДНК, розташовану між послідовностями-мішенями.

14. Спосіб спрямованої генетичної рекомбінації в рослинній клітині-хазяїні, причому спосіб включає:

(a) експресію в клітині-хазяїні пари злитих білків за п. 6 або щонайменше одного полінуклеотиду, який кодує вказану пару злитих білків, де послідовності, що є мішенями для злитих білків, присутні у вибраному локусі-мішені хазяїна;

(b) ідентифікацію рекомбінантної клітини-хазяїна, що має зміну послідовності в локусі-мішені хазяїна; і

(c) необов'язкове введення екзогенного полінуклеотиду в клітину-хазяїна, де екзогенний полінуклеотид, коли присутній, інтегрується в геном рослинної клітини-хазяїна.

15. Спосіб за п. 14, у якому зміна послідовності являє собою мутацію, вибрану з групи, що складається з делеції генетичного матеріалу, інсерції генетичного матеріалу, заміни генетичного матеріалу і будь-якого їх поєднання.

16. Спосіб зниження рівня фітинової кислоти в насінині рослини або забезпечення того, що фосфор стає метаболічно більш доступним в рослинній клітині, причому спосіб включає інактивацію або зміну гена IPP2-K за п. 15.

Текст

Реферат: Винахід належить до білка з цинковими пальцями, які містять координуючі цинк залишки ССНС. Також описано злитий білок, що містять цинкові пальці ССНС, а також полінуклеотиди, що UA 100505 C2 (12) UA 100505 C2 кодують такі білки, та способи застосування таких білків в способі спрямованої генетичної рекомбінації. UA 100505 C2 5 10 15 20 25 30 35 40 45 50 55 60 Опис ПЕРЕХРЕСНЕ ПОСИЛАННЯ НА РОДИННІ ЗАЯВКИ Дана заявка вимагає пріоритет попередньої заявки на видачу патенту США № 60/874911, поданої 14 грудня 2006 року, і попередньої заявки на видачу патенту США № 60/932497, поданої 30 травня 2007 року, обидві заявки включені в даний опис у вигляді посилання в повному обсязі. ГАЛУЗЬ ТЕХНІКИ, ДО ЯКОЇ НАЛЕЖИТЬ ВИНАХІД Даний винахід стосується галузей конструювання геномів, таргентингу генів, цілеспрямованої хромосомної інтеграції, експресії білка і епігеномного редагування. РІВЕНЬ ТЕХНІКИ Специфічне за послідовністю зв'язування білків з ДНК, РНК, білком і іншими молекулами залучене в ряд клітинних процесів, таких як, наприклад, транскрипція, реплікація, структура хроматину, рекомбінація, репарація ДНК, процесинг РНК і трансляція. Специфічність зв'язування клітинних зв’язувальних білків, які беруть участь у взаємодіях білок-ДНК, белок-РНК і білок-білок, додає внесок у розвиток, диференціювання і гомеостаз. Білки з цинковими пальцями (ZFP) являють собою білки, які можуть зв'язуватися з ДНК специфічним за послідовністю чином. Цинкові пальці спочатку були ідентифіковані в транскрипційному факторі TFIIIA з ооцитів африканської шпорцевої жаби Xenopus laevis. Одиночний домен типу цинкового пальця такого класу ZFP має довжину близько 30 амінокислот, і в декількох структурних дослідженнях показано, що він містить бета-поворот (який містить два консервативних залишки цистеїну) і альфа-спіраль (яка містить два консервативних залишки гістидину), які утримуються в особливій конформації за допомогою координаційного зв'язування атома цинку двома цистеїнами і двома гістидинами. Такий клас ZFP також відомий як C2H2-ZFP. Також запропоновані додаткові класи ZFP. Дивіться, наприклад, публікацію Jiang et al. (1996) J. Biol. Chem. 271: 10723-10730, у якій обговорюються ZFP Cys-Cys-His-Cys (C3H). До даного часу ідентифіковано більше 10000 послідовностей цинкових пальців у декількох тисячах відомих або передбачуваних факторах транскрипції. Домени типу цинкових пальців залучені не тільки в упізнавання ДНК, але також у зв'язування РНК і в білок-білкову взаємодію. За сучасними оцінками такий клас молекул буде складати приблизно 2% від усіх геномів людини. Більшість білків з цинковими пальцями мають консервативні залишки цистеїну і гістидину, які тетраедрично координують один атом цинку в кожному пальцевому домені. Зокрема, більшість ZFP характеризуються пальцевими компонентами, що мають загальну послідовність: -Cys-(X)2-4-Cys-(X)12-His-(X)3-5-His- (SEQ ID NO: 1), у якій X означає будь-яку амінокислоту (C2H2ZFP). Координуючі цинк послідовності такого найбільш широко представленого класу містять два цистеїни і два гістидини з визначеними проміжками. Утворювана в результаті фолдингу структура кожного пальця містить антипаралельний бета-поворот, область кінчика пальця і коротку амфіпатичну α-спіраль. Ліганди, що координують метал, зв'язуються з іоном цинку, і у випадку цинкових пальців типу zif268 коротка амфіпатична α-спіраль зв'язується у великій борозенці ДНК. Крім того, структура цинкового пальця стабілізується деякими консервативними гідрофобними амінокислотними залишками (наприклад, залишком, який безпосередньо передує першому консервативному Cys, і залишком у положенні +4 спіральної ділянки пальця) і в результаті координації цинку за допомогою консервативних залишків цистеїну і гістидину. Описані канонічні білки з цинковими пальцями (C2H2), які мають зміни в положеннях, що здійснюють прямі контакти з основами, у «підтримувальних» або «зміцнювальних» залишках, які безпосередньо є сусідніми з положеннями, що контактують з основами, і в положеннях, здатних контактувати з фосфатним кістяком ДНК. Дивіться, наприклад, патенти США № 6007988, 6013453, 6140081, 6866997, 6746838, 6140081, 6610512, 7101972, 6453242, 6785613, 7013219; PCT WO 98/53059; Choo et al. (2000) Curr. Opin. Struct. Biol. 10: 411-416; Segal et al. (2000) Curr. Opin. Chem. Biol. 4: 34-39. Крім того, також описані білки з цинковими пальцями, які містять цинкові пальці з модифікованими залишками, що координують цинк (дивіться, наприклад, заявки на видачу патенту США № 20030108880, 20060246567 і 20060246588; описи яких включені у вигляді посилання). Однак, хоча білки з цинковими пальцями, які містять такі неканонічні цинкові пальці, зберігають функцію регуляції транскрипції генів, їх здатність діяти як нуклеази з цинковими пальцями (ZFN) у деяких випадках знижується в порівнянні з білками, що мають цинкові пальці, які складаються винятково з канонічних цинкових пальців C2H2. Таким чином, зберігається необхідність, особливо при конструюванні нуклеаз з цинковими пальцями, у додаткових сконструйованих зв’язувальних білках з цинковими пальцями, що містять цинкові пальці, які мають оптимізовані неканонічні координуючі області. 1 UA 100505 C2 5 10 15 20 25 30 35 40 45 50 55 СУТЬ ВИНАХОДУ Даний опис стосується ДНК-зв’язувальних доменів типу цинкових пальців зі змінами щонайменше в одному залишку, що координує цинк. Зокрема, у даній публікації описані цинкові пальці CCHC. Такі цинкові пальці CCHC можуть містити додаткові зміни (заміни, інсерції і/або делеції) поблизу залишків, що координують цинк, наприклад у залишках, які оточують найближчий до C-кінця координуючий цинк залишок цинкового пальця. Також описані поліпептиди цинкових пальців і злиті білки, які містять один або декілька таких цинкових пальців CCHC, полінуклеотиди, що кодують такі цинкові пальці і злиті білки, і способи застосування таких поліпептидів цинкових пальців і/або злитих білків. Таким чином, даний опис охоплює без обмеження наступні пронумеровані варіанти: 1. Білок з цинковими пальцями, що містить неканонічний (не-C2H2) цинковий палець, при цьому неканонічний цинковий палець має спіральну частину, залучену в зв'язування ДНК, і координуюча цинк область спіральної частини містить амінокислотну послідовність HX1X2RCXL (SEQ ID NO:2); і при цьому білок з цинковими пальцями сконструйований для зв'язування послідовності-мішені. 2. Білок з цинковими пальцями за п. 1, у якому X1 означає A, і X2 означає Q. 3. Білок з цинковими пальцями за п. 1, у якому X1 означає K, і X2 означає E. 4. Білок з цинковими пальцями за п. 1, у якому X1 означає T, і X2 означає R. 5. Білок з цинковими пальцями за п. 1, у якому XL означає G. 6. Білок з цинковими пальцями, що містить два або більше цинкових пальців, у якому A B C щонайменше один цинковий палець містить послідовність Cys-(X )2-4-Cys-(X )12-His-(X )3-5-CysD A B C D (X )1-10 (SEQ ID NO: 3), де X , X , X і X можуть означати будь-яку амінокислоту. 7. Білок з цинковими пальцями за будь-яким з пп. 1-6, який містить будь-яку з послідовностей, показаних у таблицях 1, 2, 3 або 4. D 8. Білок з цинковими пальцями за будь-яким з пп. 6 або 7, у якому X містить послідовність QLV або QKP. 9. Білок з цинковими пальцями за п. 8, у якому послідовності QLV або QKP являють собою 3 C-кінцевих амінокислотних залишки цинкового пальця. D 10. Білок з цинковими пальцями за будь-яким з пп. 6-9, у якому X містить 1, 2 або 3 залишки Gly (G). 11. Білок з цинковими пальцями, який містить множину цинкових пальців, де щонайменше один з цинкових пальців містить цинковий палець CCHC за будь-яким з пп. 1-10. 12. Білок з цинковими пальцями за п. 11, у якому білок з цинковими пальцями містить 3, 4, 5 або 6 цинкових пальців. 13. Білок з цинковими пальцями за п. 11 або 12, у якому палець 2 включає в себе цинковий палець CCHC. 14. Білок з цинковими пальцями за будь-яким з пп. 11-13, у якому C-кінцевий цинковий палець включає в себе цинковий палець CCHC. 15. Білок з цинковими пальцями за будь-яким з пп. 11-14, у якому щонайменше два цинкових пальці включають в себе цинковий палець CCHC. 16. Білок з цинковими пальцями за будь-яким з пп. 11-15, у якому білок з цинковими пальцями містить будь-яку з послідовностей, показаних у таблиці 8, і сконструйований для зв'язування послідовності-мішені в гені IPP2-K. 17. Злитий білок, який містить білок з цинковими пальцями за будь-яким з пп. 1-16 і один або більше функціональних доменів. 18. Злитий білок, який містить: (a) напівдомен розщеплення, (b) білок з цинковими пальцями за будь-яким з пп. 1-16, і (c) лінкер ZC, розташований між напівдоменом розщеплення і білком з цинковими пальцями. 19. Злитий білок за п. 18, у якому довжина лінкера ZC складає 5 амінокислот. 20. Злитий білок за п. 19, у якому амінокислотна послідовність лінкера ZC являє собою послідовність GLRGS (SEQ ID NO: 4). 21. Злитий білок за п. 18, у якому довжина лінкера ZC складає 6 амінокислот. 22. Злитий білок за п. 21, у якому амінокислотна послідовність лінкера ZC являє собою послідовність GGLRGS (SEQ ID NO: 5). 23. Полінуклеотид, який кодує білок з цинковими пальцями за будь-яким з пп. 1-16 або злитий білок за будь-яким з пп. 17-22. 24. Спосіб спрямованого розщеплення клітинного хроматину в рослинній клітині, причому спосіб включає в себе експресію в клітині пари злитих білків за будь-яким з пп. 18-22; де 2 UA 100505 C2 5 10 15 20 25 30 35 40 45 50 55 60 (a) послідовності, які є мішенями для злитих білків, знаходяться в межах десяти нуклеотидів одна від одної; і (b) злиті білки димеризуються і розщеплюють ДНК, розташовану між послідовностямимішенями. 25. Спосіб спрямованої генетичної рекомбінації в рослинній клітині-хазяїні, причому спосіб включає в себе: (a) експресію в клітині-хазяїні пари злитих білків за будь-яким з пп. 18-22, де послідовності, які є мішенями для злитих білків, присутні в вибраному локусі-мішені хазяїна; і (b) ідентифікацію рекомбінантної клітини-хазяїна, яка має зміну послідовності в локусімішені хазяїна. 26. Спосіб за будь-яким з пп. 24 або 25, у якому зміна послідовності являє собою мутацію, вибрану з групи, що складається з делеції генетичного матеріалу, інсерції генетичного матеріалу, заміни генетичного матеріалу і будь-якого їх сполучення. 27. Спосіб за будь-яким з пп. 24-26, який додатково включає в себе введення екзогенного полінуклеотиду в клітину-хазяїна. 28. Спосіб за п. 27, у якому екзогенний полінуклеотид містить послідовності, гомологічні локусу-мішені хазяїна. 29. Спосіб за будь-яким з пп. 24-28, у якому рослина вибрана з групи, що складається з однодольної рослини, дводольної рослини, голонасінної рослини і еукаріотичної водорості. 30. Спосіб за п. 29, у якому рослина вибрана з групи, що складається з маїсу, рису, пшениці, картоплі, сої, томата, тютюну, представників сімейства Brassica і Arabidopsis. 31. Спосіб за будь-яким з пп. 24-29, у якому рослина являє собою дерево. 32. Спосіб за будь-яким з пп. 24-31, у якому послідовності-мішені знаходяться в гені IPP2K. 33. Спосіб зниження рівня фітинової кислоти в насінні, причому спосіб включає в себе інактивацію або зміну гена IPP2-K за п. 32. 34. Спосіб одержання метаболічно більш доступного фосфору в насінні, причому спосіб включає в себе інактивацію або зміну гена IPP2-K за п. 32. 35. Рослинна клітина, яка містить білок з цинковими пальцями за будь-яким з пп. 1-16, злитий білок за будь-яким з пп. 17-22 або полінуклеотид за п. 23. 36. Рослинна клітина за п. 35, де клітина є клітиною насіння. 37. Рослинна клітина за п. 36, де насіння є насінням кукурудзи. 38. Рослинна клітина за будь-яким з пп. 35-37, де IPP2-K частково або повністю інактивований. 39. Рослинна клітина за п. 38, де рівні фітинової кислоти в насінні знижені. 40. Рослинна клітина за пп. 35-39, де метаболічно доступні рівні фосфору в клітині підвищені. КОРОТКИЙ ОПИС КРЕСЛЕНЬ Фігура 1 являє собою графік, на якому зображені частоти коректування генів, які виміряні по процентному вмісту клітин, експресуючих GFP, у системі аналізу клітинного репортера GFP, що описана в патенті США № 2005/0064474 і нижче. Варіанти ZFN позначені «X-Y», де «X» належить до номера таблиці, а «Y» належить до номера, наданого цинковому пальцю в конкретній вибраній таблиці. Наприклад, «2-21» стосується ZFN, що має палець, який містить послідовність, показану в таблиці 2 у рядку під номером 21, а саме HAQRCGLRGSQLV (SEQ ID NO: 53). Фігура 2 являє собою графік, на якому зображений виражений у відсотках сигнал Cel-1, що виникає в результаті розщеплення з використанням різних пар варіантів ZFN. Показані результати двох експериментів для кожної пари ZFN відносно номера кожного зразка. Пари варіантів, використовуваних для кожного зразка, показані в рамці в правому верхньому куті, де «wt 5-8» і «wt 5-9» стосується канонічних пар ZFN, описаних у прикладі 14 (таблиця 17) заявки на видачу патенту США № 20050064474. У зразках 3-12 C-кінцева область спіралей упізнавання пальця 2 або пальця 4 канонічної ZFN 5-8 або 5-9 замінені неканонічними послідовностями. Неповна послідовність неканонічних варіантів ZFN, позначених 20, 21, 43, 45, 47 і 48, у зразках 3-12 і положення пальців таких варіантів у 4-пальцевій ZFN показані у верхньому лівому куті над графіком. Зірочка над стовпцем, який зображує результати експерименту 2 для зразків 8 і 9, показує фон на доріжці, що приводить до заниженої оцінки ефективності ZFN. Фігура 3 являє собою графік, на якому зображені частоти коректування генів, одержані в системі аналізу клітинного репортера GFP, описаній в патенті США № 2005/0064474 і в даній публікації. Пари ZFN, тестовані в кожному зразку, зазначені під кожним стовпцем, при цьому цинкові пальці під номерами 20, 21, 43, 45, 47 і 48 являють собою цинкові пальці, описані в прикладі 3, і цинкові пальці CCHC 1a-10a містять послідовність, показану в таблицях 3 і 4. 3 UA 100505 C2 5 10 15 20 25 30 35 40 45 50 55 Цинкові пальці 20, 21, 7a, 8a, 9a і 10a використовували для пальця 4; цинкові пальці 43, 45, 47, 48, 1a, 2a, 3a, 4a, 5a і 6a використовували для пальця 2. Фігура 4 є лінійним схематичним представленням плазміди pDAB1585, вектора-мішені для тютюну. Фігура 5 є схематичним представленням плазміди pDAB1585, вектора-мішені для тютюну. Фігури 6A і 6B зображують нуклеази з цинковими пальцями (ZFN). Фігура 6A є схематичним зображенням зв'язування ZFN. На фігурі 6B показана послідовність послідовності-мішені. Фігура 7 є схематичним представленням плазміди pDAB1400. Фігура 8 є схематичним представленням плазміди pDAB782. Фігура 9 є схематичним представленням плазміди pDAB1582. Фігура 10 є схематичним представленням плазміди pDAB354. Фігура 11 є схематичним представленням плазміди pDAB1583. Фігура 12 є схематичним представленням плазміди pDAB2407. Фігура 13 є схематичним представленням плазміди pDAB1584. Фігура 14 є схематичним представленням плазміди pDAB2418. Фігура 15 є схематичним представленням плазміди pDAB4045. Фігура 16 є схематичним представленням плазміди pDAB1575. Фігура 17 є схематичним представленням плазміди pDAB1577. Фігура 18 є схематичним представленням плазміди pDAB1579. Фігура 19 є схематичним представленням плазміди pDAB1580. Фігура 20 є схематичним представленням плазміди pDAB3401. Фігура 21 є схематичним представленням плазміди pDAB1570. Фігура 22 є схематичним представленням плазміди pDAB1572. Фігура 23 є схематичним представленням плазміди pDAB4003. Фігура 24 є схематичним представленням плазміди pDAB1571. Фігура 25 є схематичним представленням плазміди pDAB7204. Фігура 26 є схематичним представленням плазміди pDAB1573. Фігура 27 є схематичним представленням плазміди pDAB1574. Фігура 28 є схематичним представленням плазміди pDAB1581. Фігура 29 є схематичним представленням плазміди pDAB1576. Фігура 30 є схематичним представленням плазміди pDAB1600. Фігура 31 є схематичним представленням плазміди pDAB3731. Фігура 32 є схематичним представленням плазміди pDAB4322. Фігура 33 є схематичним представленням плазміди pDAB4331. Фігура 34 є схематичним представленням плазміди pDAB4332. Фігура 35 є схематичним представленням плазміди pDAB4333. Фігура 36 є схематичним представленням плазміди pDAB4334. Фігура 37 є схематичним представленням плазміди pDAB4336. Фігура 38 є схематичним представленням плазміди pDAB4339. Фігура 39 є схематичним представленням плазміди pDAB4321. Фігура 40 є схематичним представленням плазміди pDAB4323. Фігура 41 є схематичним представленням плазміди pDAB4341. Фігура 42 є схематичним представленням плазміди pDAB4342. Фігура 43 є схематичним представленням плазміди pDAB4343. Фігура 44 є схематичним представленням плазміди pDAB4344. Фігура 45 є схематичним представленням плазміди pDAB4346. Фігура 46 є схематичним представленням плазміди pDAB4330. Фігура 47 є схематичним представленням плазміди pDAB4351. Фігура 48 є схематичним представленням плазміди pDAB4356. Фігура 49 є схематичним представленням плазміди pDAB4359. Фігура 50 є схематичним представленням плазміди pDAB7002. Фігура 51 є схематичним представленням плазміди pDAB7025. Фігура 52 є схематичним представленням плазміди pDAB1591. Фігура 53 є схематичним представленням плазміди pcDNA3.1-SCD27a-L0-Fok, ДНК-матриці, використовуваної для ПЛР-ампліфікації Scd27-ZFN. Фігура 54 є схематичним представленням плазміди pDAB1594. Фігура 55 є схематичним представленням плазміди pDAB1598. Фігура 56 є схематичним представленням плазміди pDAB1577. Фігура 57 є схематичним представленням плазміди pDAB1578. 4 UA 100505 C2 5 10 15 20 25 30 35 40 45 50 55 Фігура 58 є схематичним представленням плазміди pDAB1601, контрольного вектора гена PAT. Фігура 59 є схематичним зображенням прогнозованої внутрішньохромосомної гомологічної рекомбінації, стимульованої злитим білком IL-1-FokІ. Фігура 60 є схематичним представленням плазміди pDAB1590, позитивного GFPекспресуючого контролю. Фігура 61 є схематичним зображенням прогнозованої міжхромосомної гомологічної рекомбінації, стимульованої злитим білком цинковий палець IL-1-FokІ. Фігура 62 є схематичним зображенням прогнозованої міжхромосомної гомологічної рекомбінації, стимульованої злитим білком цинковий палець Scd27-FokІ. На фігурі 63 показаний гель, що представляє ПЛР-аналіз рекомбінантів. Перші 4 доріжки ліворуч підписані над зображенням гелю. Доріжки, позначені 1-5, показують події HR в результаті трансформації BY2-380 геном злитого білка C3H IL-1-FokІ, і доріжки, позначені 6-7, показують події HR в результаті трансформації BY2-380 геном злитого білка C3H SCD27-FokІ. На фігурі 64 показана послідовність гена BPP2K маїсу (SEQ ID NO: 6), одержана з культури клітин HiII, яка служить як матриця для конструювання ZFN, спрямованих до IPP2K маїсу. На фігурі 65, панелі A-E, зображена схема клонування експресуючого вектора ZFN. Використовували покрокову методику клонування для створення конструкцій для експресії ZFN. Окремі ZFN-кодуючі гени клонували у векторах pVAX-N2A-NLSop2-EGFP-FokMono (A) і pVAXC2A-NLSop2-EGFP-FokMono (B) для створення двобілкової касети (C). Таку касету лігували в pDAB3872 (D) для створення кінцевої плазміди (E) для експресії гетеродимеру ZFN. На фігурі 66 зображене зв'язування ZFN у гені IPP2K маїсу. Потрібні два білки ZFN для здійснення двониткового розщеплення ДНК. Показана послідовність, яка оточує сайт розщеплення (зазначений спрямованою вниз стрілкою) (SEQ ID NO: 7). Один білок (8705) зв'язувався з послідовністю CTGTGGGGCCAT (верхня нитка) (SEQ ID NO: 8), при цьому інший білок (8684, 8685 або 8686) зв'язувався з розташованою нижче послідовністю (CTTGACCAACTCAGCCAG, нижня нитка) (SEQ ID NO: 9). На фігурі 67 зображені послідовності дикого типу (верхня послідовність, SEQ ID NO: 10) і клону ZFN 127 (нижня послідовність, SEQ ID NO: 11). Мішень розщеплення для такої ZFN виділена сірим прямокутником. На фігурі 68 показане вирівнювання множинних делецій, що виникають в результаті зв'язування негомологічних кінців (NHEJ) опосередкованого ZFN розриву днДНК у гені IPP2K маїсу, яке виявляли секвенуванням 454. Мішень розщеплення для такої ZFN виділена сірим прямокутником. Фігура 69 являє собою графік, на якому зображені частоти коректування генів у системі аналізу клітинного репортера GFP, описаної в патенті США № 2005/0064474 і в даній публікації. Пари ZFN, тестовані в кожнім зразку, показані під кожним стовпцем. На фігурі 70 зображена плазміда pDAB7471, сконструйована як описано в прикладі 18B. На фігурі 71 зображена плазміда pDAB7451, сконструйована, як описано в прикладі 18C. Фігура 72 є схематичним зображенням прикладу автономної касети експресії гена стійкості до гербіцидів. Така конструкція містить повну промоторно-транскрипційну одиницю (PTU), що містить промотор, ген стійкості до гербіцидів і послідовність термінації поліаденілювання (поліA), які описані в прикладі 18D. На фігурі 73 зображена плазміда pDAB7422, сконструйована, як описано в прикладі 18E. Плазміда містить повну промоторно-транскрипційну одиницю (PTU), що містить промотор, ген стійкості до гербіциду і послідовність термінації поліаденілювання (полі-A), вбудовані в кістяк плазміди з положенням 1. На фігурі 74 зображена плазміда pDAB7452, сконструйована, як описано в прикладі 18E. Плазміда містить повну промторно-транскрипційну одиницю (PTU), що містить промотор, ген стійкості до гербіцидів і послідовність термінації поліаденілювання (полі-A), вбудовану в кістяк плазміди з положенням 2. Фігура 75 є схематичним зображенням прикладу неавтономної касети експресії гена стійкості до гербіцидів. Така конструкція містить неповну промоторно-транскрипційну одиницю (PTU), що містить ген стійкості до гербіцидів і послідовність термінації поліаденілювання (поліА), яка описана в прикладі 18F. На фігурі 76 зображена плазміда pDAB7423, сконструйована, як описано в прикладі 18G. Така плазміда містить неповну промоторно-транскрипційну одиницю (PTU), що містить ген стійкості до гербіцидів і послідовність термінації поліаденілювання (полі-A), вбудовану в кістяк плазміди з положенням 1. 5 UA 100505 C2 5 10 15 20 25 30 35 40 45 50 55 На фігурі 77 зображена плазміда pDAB7454, сконструйована, як описано в прикладі 18G. Плазміда містить неповну промоторно-транскрипційну одиницю (PTU), що містить ген стійкості до гербіцидів і послідовність термінації поліаденілювання (полі-A), вбудовану в кістяк плазміди з положенням 2, як описано в прикладі 18G. На фігурі 78 зображена плазміда pDAB7424 (приклад Gateway®-адаптованого автономного донора для положення 1), сконструйована, як описано в прикладі 18H. На фігурі 79 зображена плазміда pDAB7425 (приклад Gateway®-адаптованого автономного донора для положення-1), сконструйована, як описано в прикладі 18H. На фігурі 80 зображена плазміда pDAB7426, сконструйована, як описано в прикладі 18H. рDAB7426 є комбінацією плазміди, що містить автономний донор для положення 1, з касетою експресії ZFN. На фігурі 81 зображена плазміда pDAB7427, сконструйована, як описано в прикладі 18H. pDAB7427 є комбінацією плазміди, що містить автономний донор для положення 1, з касетою експресії ZFN. На фігурі 82 зображена ампліфікація специфічних для донорної ДНК послідовностей з геномної ДНК. Наявність продукту довжиною 317 п.н. є ознакою присутності донорної ДНК, що містить ген PAT, вбудованої в геном калусів маїсу ліній № 61-72, як описано в прикладі 20C. HiII означає негативний контроль дикого типу. На фігурі 83 зображена ампліфікація 5'-границі між донорною ДНК і геномними послідовностями маїсу, специфічними для EPP2K. Продукти другої ПЛР, одержані в результаті цілеспрямованої інтеграції донора в ген IPP2K, діагностували по наявності фрагментів ДНК довжиною 1,65 т.п.н., як описано в прикладі 21A. HiII означає негативний контроль дикого типу. На фігурі 84 зображена ампліфікація 3'-границі між донорною ДНК і геномними послідовностями маїсу, специфічними для IPP2K. Продукти другої ПЛР, одержані в результаті цілеспрямованої інтеграції донора в ген IPP2K, діагностували по наявності фрагментів ДНК довжиною 1,99 т.п.н., як описано в прикладі 21A. HiII означає негативний контроль дикого типу. На фігурі 85 зображена ампліфікація розташованої вище по ходу транскрипції (5'-) границі між геномом і донором. Продукти ПЛР, одержані в результаті цілеспрямованої інтеграції донора в ген EPP2K, (5'-границі) діагностували по наявності фрагментів ДНК розміром 1,35 т.п.н., як описано в прикладі 21B. HiII означає негативний контроль дикого типу. На фігурі 86 зображена ампліфікація розташованої нижче по ходу транскрипції (3'-) границі між донором і геномом. Продукти ПЛР, одержані в результаті цілеспрямованої інтеграції донора в ген IPP2K, (3'-границі) діагностували по наявності фрагментів ДНК розміром 1,66 т.п.н., як описано в прикладі 21B. HiII означає негативний контроль дикого типу. На фігурі 87 зображена 5'-фланкуюча послідовність гомології положення-1 (SEQ ID NO: 171). На фігурі 88 зображена 3'-фланкуюча послідовність гомології положення-1 (SEQ ID NO: 172). На фігурі 89 зображена 5'-фланкуюча послідовність гомології положення-2 (SEQ ID NO: 139). На фігурі 90 зображена 3'-фланкуюча послідовність гомології положення-2 (SEQ ID NO: 140). На фігурі 91 зображена послідовність розташованої вище (5'-) геномної послідовності IPP2K областей, які є мішенями ZFN (SEQ ID NO: 141). На фігурі 92 зображена послідовність розташованої нижче (3'-) геномної послідовності IPP2K областей, які є мішенями ZFN (SEQ ID NO: 142). ДОКЛАДНИЙ ОПИС У даному описі розкриті композиції, що містять зв’язувальні поліпептиди типу цинкових пальців (ZFP), які включають у себе неканонічні цинкові пальці форми Cys-Cys-His-Cys. Оскільки координація цинку забезпечує основну енергію для фолдингу цинкових пальців, то коректування залишків, що координують цинк, забезпечує доступні засоби для модифікації стабільності і структури пальців, які впливають на множину важливих функціональних ознак білків з цинковими пальцями, включаючи, наприклад, час напівжиття в клітині, взаємодії з іншими клітинними факторами, специфічність і афінність зв'язування ДНК і відносну орієнтацію функціональних доменів. Показано, що білки з цинковими пальцями, які містять неканонічні цинкові пальці, такі як пальці, описані в заявках на видачу патенту США № 20030108880, 20060246567 і 20060246588, зв'язуються з ДНК і змінюють транскрипцію. Однак при включенні в нуклеази з цинковими пальцями (ZFN, дивіться, наприклад публікацію заявки на видачу патенту США № 6 UA 100505 C2 5 10 15 20 25 30 35 40 45 50 55 20050064474), такі раніше описані неканонічні білки з цинковими пальцями іноді можуть виявляти субоптимальну активність у розщепленні ДНК-мішені. У даній публікації описані білки з цинковими пальцями, що містять один або декілька цинкових пальців CCHC, у яких специфічні послідовності, що оточують C-кінцеву пару координуючих цинк залишків, були змінені. Також описані злиті білки, наприклад, нуклеази з цинковими пальцями (ZFN), які містять такі оптимізовані неканонічні цинкові пальці, при цьому ZFN розщеплюють ДНК-мішень у ступені, сумісному з розщепленням, яке досягається з використанням ZFN, що містять канонічні (CCHH) цинкові пальці. Злиті поліпептиди, що розкриті в даному описі, можуть підсилювати або пригнічувати транскрипцію гена і/або розщеплювати послідовність-мішень. Також пропонуються полінуклеотиди, які кодують оптимізовані неканонічні цинкові пальці, і полінуклеотиди, які кодують злиті білки, що містять один або декілька оптимізованих неканонічних цинкових пальців. Крім того, пропонуються фармацевтичні композиції, які містять терапевтично ефективну кількість будь-якого з поліпептидів цинкових пальців, що зв'язують нуклеотиди, описаних у даній публікації, або їх функціональних фрагментів; або терапевтично ефективну кількість нуклеотидної послідовності, що кодує будь-який з модифікованих поліпептидів цинкових пальців, що зв’язують нуклеотиди, або їх функціональних фрагментів, у сполученні з фармацевтично прийнятним носієм. Додатково пропонуються сільськогосподарські композиції, що містять агрономічно ефективну кількість будь-якого з поліпептидів цинкових пальців, що зв’язують нуклеотиди, описаних у даній публікації, або їх функціональних фрагментів; або агрономічно ефективну кількість нуклеотидної послідовності, яка кодує будь-який з модифікованих поліпептидів цинкових пальців, що зв’язують нуклеотиди, або їх функціональних фрагментів, у сполученні з прийнятним з погляду сільського господарства носієм. Також пропонуються способи скринінгу для одержання модифікованого поліпептиду цинкового пальця, що зв’язує нуклеотиди, який зв'язується з геномною послідовністю. До геномних послідовностей належать послідовності, які присутні у хромосомах, епісомах, геномах органел (наприклад, мітохондрій, хлоропластів), штучні хромосоми і будь-який інший тип нуклеїнової кислоти, присутньої у клітині, такий як, наприклад, ампліфіковані послідовності, подвійні мікрохромосоми і геноми ендогенних або інфікуючих бактерій і вірусів. Геномні послідовності можуть бути нормальними (тобто, дикого типу) або мутантними; мутантні послідовності можуть містити, наприклад, інсерції, делеції, заміни, транслокації, реаранжируваня і/або точкові мутації. Геномна послідовність також може містити один з декількох різних алелів. Загальні відомості При практичному здійсненні способів, а також при одержанні і застосуванні композицій, описаних у даній публікації, якщо не зазначене інше, використовують звичайні методики молекулярної біології, біохімії, аналізу структури хроматину, обчислювальної хімії, культивування клітин, рекомбінантної ДНК і методики з родинних галузей, відомі з рівня техніки. Такі способи повністю пояснені в літературі. Дивіться, наприклад, Sambrook et al. Molecular Cloning: a Laboratory Manual, Second edition, Cold Spring Harbor Laboratory Press, 1989 і Third edition, 2001; Ausubel et al., Current protocols in molecular biology, John Wiley and Sons, New York, 1987 і періодичні видання; серію Methods in Enzymology, Academic Press, San Diego; Wolffe, Chromatin Structure and Function, Third edition, Academic Press, San Diego, 1998; Methods in Enzymology, Vol. 304, «Chromatin» (P.M. Wassarman and A. P. Wolffe, eds.), Academic Press, San Diego, 1999; і Methods in Molecular Biology, Vol. 119, «Chromatin Protocols» (P.B. Becker, ed.) Humana Press, Totowa, 1999. Визначення Терміни «нуклеїнова кислота», «полінуклеотид» і «олігонуклеотид» використовують взаємозамінно, і вони стосуються дезоксирибонуклеотидного або рибонуклеотидного полімеру в лінійній або кільцевій конформації й або в однонитковій, або в двонитковій формі. З метою даного опису зазначені терміни не слід тлумачити як такі, що обмежують довжину полімеру. Терміни можуть охоплювати відомі аналоги природних нуклеотидів, а також нуклеотиди, що модифіковані по основі, цукру і/або залишку фосфату (наприклад, фосфоротіоатні кістяки). Загалом, аналог конкретного нуклеотиду має таку ж як і у нуклеотиду специфічність у спарюванні основ; тобто аналог A буде утворювати пару з T. Терміни «поліпептид», «пептид» і «білок» використовують взаємозамінно стосовно полімеру з амінокислотних залишків. Термін також застосовний відносно полімеру амінокислот, у яких одна або декілька амінокислот являють собою хімічні аналоги або модифіковані похідні відповідних амінокислот, що зустрічаються в природі. 7 UA 100505 C2 5 10 15 20 25 30 35 40 45 50 55 «Зв'язування» стосується специфічної для послідовності нековалентної взаємодії між макромолекулами (наприклад, між білком і нуклеїновою кислотою). Не всі компоненти, що беруть участь у взаємодії при зв'язуванні, повинні бути специфічними відносно послідовності (наприклад, контакти з фосфатними залишками в кістяку ДНК), за умови, що взаємодія загалом є специфічною для послідовності. Такі взаємодії загалом характеризуються константою -6 -1 дисоціації (Kd) 10 М або менше. «Афінність» стосується сили зв'язування: підвищена афінність зв'язування корелює з більш низьким значенням Kd. «Зв’язувальний білок» являє собою білок, який здатний нековалентно зв'язуватися з іншою молекулою. Зв’язувальний білок може зв'язуватися, наприклад, з молекулою ДНК (ДНКзв’язувальний білок), молекулою РНК (РНК-з’язувальний білок) і/або молекулою білка (білокзв’язувальний білок). У випадку білок-зв’язувального білка він може зв'язуватися з таким же білком (з утворенням гомодимерів, гомотримерів і т. д.), і/або він може зв'язуватися з однією або декількома молекулами іншого білка або білків. Зв’язувальний білок може мати більше ніж одну активність зв'язування. Наприклад, білки з цинковими пальцями мають ДНК-зв’язувальну, РНКзв’язувальну і білок-зв’язувальну активність. «ДНК-зв’язувальний білок з цинковими пальцями» (або зв’язувальний домен) являє собою білок або домен у більш великому білку, який зв'язує ДНК специфічним для послідовності чином за допомогою одного або декількох цинкових пальців, які є областями амінокислотної послідовності в зв’язувальному домені, структура яких стабілізується в результаті координації іона цинку. Термін ДНК-зв’язувальний білок з цинковими пальцями часто скорочено називають білком з цинковими пальцями або ZFP. Зв’язувальні домени типу цинкових пальців можуть бути «сконструйовані» так, щоб вони зв'язувалися з попередньо визначуваною нуклеотидною послідовністю. Необмежувальними прикладами способів створення білків з цинковими пальцями є конструювання і селекція. Сконструйований білок з цинковими пальцями являє собою білок, що не зустрічається в природі, конструкція/склад якого головним чином визначається раціональними критеріями. Раціональні критерії для конструювання включають застосування правил заміни і комп'ютерних алгоритмів для обробки інформації, що зберігається в базі даних, про існуючі конструкції ZFP і даних про зв'язування. Дивіться, наприклад, патенти США № 6140081, 6453242, 6534261 і 6785613; також дивіться WO 98/53058, WO 98/53059, WO 98/53060, WO 02/016536 і WO 03/016496 і патенти США № 6746838, 6866997 і 7030215. «Відібраний при селекції» білок з цинковими пальцями являє собою білок, що не зустрічається в природі, який одержують, головним чином, з використанням емпіричного процесу, наприклад, з використанням фагового дисплея, пастки або взаємодії селекції гібридів. Дивіться, наприклад US 5789538, US 5925523, US 6007988, US 6013453, US 6200759, US 6733970, US RE39229 і WO 95/19431, WO 96/06166, WO 98/53057, WO 98/54311, WO 00/27878, WO 01/60970, WO 01/88197 і WO 02/099084. «Неканонічний» білок з цинковими пальцями являє собою білок, що містить неканонічний (не-C2H2) цинковий палець. Відповідно, неканонічний цинковий палець містить заміну, додавання і/або делецію щонайменше однієї амінокислоти в порівнянні з білком з цинковим пальцем C2H2, що зустрічається в природі. Необмежувальні приклади неканонічних цинкових пальців включають цинкові пальці, які містять координуючі цинк залишки (від амінокінця до карбоксильного кінця) Cys-Cys-His-Cys (тобто C3H). «Гомологічна послідовність» стосується першої послідовності, яка має визначений ступінь ідентичності по послідовності з другою послідовністю, і послідовність якої може бути ідентична другій послідовності. «Гомологічна неідентична послідовність» стосується першої послідовності, яка має визначений ступінь ідентичності по послідовності з другою послідовністю, але послідовність якої не ідентична другій послідовності. Наприклад, полінуклеотид, що містить послідовність дикого типу, яка відповідає мутантному гену, є гомологічним і неідентичним послідовності мутантного гена. У деяких варіантах ступінь гомології між двома послідовностями достатній для того, щоб забезпечити гомологічну рекомбінацію між ними з використанням звичайним клітинних механізмів. Дві гомологічні неідентичні послідовності можуть бути будьякої довжини, і ступінь відхилення від гомології може визначатися лише одним нуклеотидом (наприклад, у випадку корекції геномної точкової мутації за допомогою цілеспрямованої гомологічної рекомбінації) або 10 або більше тисячами нуклеотидів (наприклад, у випадку інсерції гена в попередньо визначувану ділянку в хромосомі). Два полінуклеотиди, що містять гомологічні неідентичні послідовності, необов'язково повинні бути однакової довжини. Наприклад, можна використовувати екзогенний полінуклеотид (тобто донорний полінуклеотид) довжиною від 20 до 10000 нуклеотидів або пар нуклеотидів. 8 UA 100505 C2 5 10 15 20 25 30 35 40 45 50 55 60 Способи визначення ідентичності послідовностей нуклеїнових кислот і амінокислотних послідовностей відомі в даній галузі. Звичайно такі способи включають в себе визначення нуклеотидної послідовності мРНК для гена і/або визначення кодованої нею амінокислотної послідовності і порівняння таких послідовностей із другою нуклеотидною або амінокислотною послідовністю. Таким чином можна визначити і порівняти геномні послідовності. Загалом, ідентичність стосується точної відповідності нуклеотиду з нуклеотидом або амінокислоти з амінокислотою в двох полінуклеотидах або поліпептидних послідовностях, відповідно. Дві або більше послідовностей (полінуклеотидних або амінокислотних) можна порівняти, визначаючи їх ідентичність у відсотках. Ідентичність у відсотках двох послідовностей, або послідовностей нуклеїнових кислот, або амінокислотних послідовностей, являє собою кількість точних збігів між вирівняними послідовностями, розділену на довжину більш коротких послідовностей і помножену на 100. Зразкове вирівнювання послідовностей нуклеїнових кислот здійснюють з використанням алгоритму пошуку локальної гомології Smith and Waterman, Advances in Applied Mathematics 2: 482-489 (1981). Зазначений алгоритм може бути застосований до амінокислотних послідовностей з використанням матриці підрахунку, розробленої Dayhoff, Atlas of Protein Sequences and Structure. M. O. Dayhoff ed., 5 suppl. 3: 353-358, National Biomedical Research Foundation, Washington, D. C, USA, і нормалізованої Gribskov, Nucl. Acids Res. 14(6): 6745-6763 (1986). Приклад виконання такого алгоритму для визначення ідентичності послідовностей у відсотках пропонується Genetics Computer Group (Madison, WI) у додатку до сервісної програми «BestFit». Параметри за замовчуванням для такого способу описані в Wisconsin Sequence Analysis Package Program Manual, Version 8 (1995) (доступно від Genetics Computer Group, Madison, WI). Прикладом способу встановлення ідентичності у відсотках у контексті даного опису є застосування пакета програм MPSRCH, авторські права на який належать Единбурзькому університету, який розроблений John F. Collins і Shane S. Sturrok і поширюється IntelliGenetics, Inc. (Mountain View, CA). З зазначеного пакета програм можна використовувати алгоритм Сміта-Ватермана, при цьому застосовуючи параметри за замовчуванням для оцінної таблиці (наприклад, штраф за відкриття пробілу 12, штраф за розширення пробілу - одиниця, і пробіл - шість). Одержуване на основі даних значення «Match» (збігів) відображає ідентичність послідовностей. Інші придатні програми для розрахунку ідентичності або подібності між послідовностями у відсотках звичайно відомі в даній галузі, наприклад, іншою програмою вирівнювання є програма BLAST, використовувана з параметрами за замовчуванням. Наприклад, можна застосовувати BLASTN і BLASTP, використовуючи наступні параметри за замовчуванням: генетичний код = стандартний; фільтр = немає; нитка = обидві; відсікання = 60; чекання = 10; матриця = BLOSUM62; описи = 50 послідовностей; сортування = HIGH SCORE; бази даних = non-redundant, GenBank + EMBL + DDBJ + PDB + GenBank CDS translations + Swiss білок + Spupdate + PIR. Подробиці застосування таких програм можна знайти в Інтернеті. Відносно послідовностей, описаних у даній публікації, діапазон необхідного ступеня ідентичності послідовностей складає приблизно від 35% до 100% і будь-яке ціле число між зазначеними значеннями. Звичайно ідентичність у відсотках між послідовностями складає щонайменше 35%-40%, 40%-45%, 45%-50%, 50%-60%, 60%-70%, 7075%, переважно 80-82%, більш переважно 85-90%, ще більш переважно 92%, ще більш переважно 95% і найбільш переважно ідентичність послідовностей складає 98%. Альтернативно ступінь подібності послідовностей між полінуклеотидами можна визначити за допомогою гібридизації полінуклеотидів в умовах, які забезпечують можливість утворення стабільних дуплексів між гомологічними областями, з наступним розщепленням нуклеазою (нуклеазами), специфічною відносно однониткової молекули, і визначенням розміру розщеплених фрагментів. Дві нуклеїнових кислоти або дві поліпептидних послідовності по суті гомологічні одна одній, коли послідовності мають щонайменше приблизно 70%-75%, переважно 80%-82%, більш переважно 85%-90%, ще більш переважно 92%, ще більш переважно 95% і найбільш переважно 98% ідентичність послідовностей протягом визначеної довжини молекул, яку визначають, використовуючи описані вище способи. У використовуваному в даному описі розумінні термін «по суті гомологічні» також стосується послідовностей, що мають повну ідентичність з конкретною послідовністю ДНК або поліпептидною послідовністю. Послідовності ДНК, які є в значній мірі гомологічними, можуть бути ідентифіковані в експерименті з використанням гібридизації за Саузерном, наприклад, у жорстких умовах, які визначені для даної конкретної системи. Визначення придатних умов гібридизації відоме в даній галузі. Дивіться, наприклад, Sambrook et al., вище; Nucleic acid Hybridization: A Practical Approach, editors B. D. Hames and S. J. Higgins, (1985) Oxford; Washington, DC; ERL Press. Вибірна гібридизація двох фрагментів нуклеїнових кислота може бути визначена наступним чином. Ступінь ідентичності послідовностей між двома молекулами нуклеїнових кислот впливає 9 UA 100505 C2 5 10 15 20 25 30 35 40 45 50 55 60 на ефективність і силу подій гібридизації між такими молекулами. Частково ідентична послідовність нуклеїнової кислоти буде щонайменше частково інгібувати гібридизацію повністю ідентичної послідовності з молекулою-мішенню. Інгібування гібридизації повністю ідентичної послідовності можна оцінити, використовуючи аналізи гібридизації, які добре відомі в даній галузі (наприклад Саузерн-блот (ДНК), Нозерн-блот (РНК), гібридизація в розчині або тому подібні, дивіться Sambrook, et al., Molecular Cloning: A Laboratory Manual, Second Edition, (1989) Cold Spring Harbor, N. Y.). Такі аналізи можна проводити, використовуючи різні ступені вибірності, наприклад, використовуючи умови, які варіюють від низької до високої жорсткості. Якщо використовують умови низької жорсткості, то відсутність неспецифічного зв'язування можна оцінити за допомогою другого зонда, який не має навіть часткового ступеня ідентичності послідовності (наприклад, зонда, який має менше ніж приблизно 30% ідентичність послідовності з послідовністю молекули-мішені), так, що під час відсутності неспецифічних подій зв'язування другий зонд не буде гібридизуватися з мішенню. При використанні основаної на гібридизації системи реєстрації вибирають нуклеїнову кислоту-зонд, яка комплементарна еталонній послідовності нуклеїнової кислоти, і потім у випадку підбору придатних умов зонд і еталонна послідовність вибірно гібридизуються або зв'язуються одне з одним з утворенням молекули дуплексу. Молекула нуклеїнової кислоти, що здатна вибірно гібридизуватися з еталонною послідовністю в умовах гібридизації помірної жорсткості, звичайно гібридизується в умовах, які дозволяють виявляти послідовність нуклеїнової кислоти-мішені довжиною щонайменше приблизно 10-14 нуклеотидів, що має щонайменше приблизно 70% ідентичність послідовності з послідовністю вибраної нуклеїнової кислоти зонда. Жорсткі умови гібридизації звичайно дозволяють виявляти послідовності нуклеїнових кислот-мішеней довжиною щонайменше приблизно 10-14 нуклеотидів, що мають ідентичність послідовностей більше ніж приблизно 90-95% з послідовністю вибраної нуклеїнової кислоти-зонда. Умови гібридизації, застосовні для гібридизації зонда/еталонної послідовності, для випадку, коли зонд і еталонна послідовність мають конкретний ступінь ідентичності послідовностей, можна визначити відомими в даній галузі способами (дивіться, наприклад, Nucleic Acid Hybridization: A Practical Approach, editors B. D. Hames and S. J. Higgins, (1985) Oxford; Washington, DC; IRL Press). Умови гібридизації добре відомі фахівцям у даній галузі. Жорсткість гібридизації стосується ступеня, при якому умови гібридизації несприятливі для утворення гібридів, що містять помилково спарені нуклеотиди, причому більш висока жорсткість корелює з більш низькою стійкістю відносно помилково спарених гібридів. Фактори, що впливають на жорсткість гібридизації, добре відомі фахівцям у даній галузі і включають в себе без обмеження температуру, pН, іонну силу і концентрацію органічних розчинників, таки як, наприклад, формамід і диметилсульфоксид. Як відомо фахівцям у даній галузі, жорсткість зростає при більш високих температурах, більш низькій іонній силі і більш низьких концентраціях розчинників. Що стосується умов жорсткості для гібридизації, то в даній галузі добре відомо, що можна використовувати різні еквівалентні умови, щоб установити конкретну жорсткість, варіюючи, наприклад, наступні фактори: довжину і природу послідовностей, склад основ різних послідовностей, концентрації солей і інших компонентів у розчині для гібридизації, присутність або відсутність блокувальних засобів у розчинах для гібридизації (наприклад, декстрансульфату і поліетиленгліколю), температурні і часові параметри реакції гібридизації, а також варіюючи умови промивання. Підбор конкретного набору умов гібридизації здійснюють, додержуючись стандартних для даної галузі способів (дивіться, наприклад, Sambrook, et al., Molecular Cloning: A Laboratory Manual. Second Edition, (1989) Cold Spring Harbor, N. Y.). «Рекомбінація» стосується способу обміну генетичною інформацією між двома полінуклеотидами. З метою даного опису «гомологічна рекомбінація (HR)» стосується спеціальної форми такого обміну, який відбувається, наприклад, під час репарації двониткових розривів у клітині. Для такого процесу необхідна гомологія нуклеотидних послідовностей, використовується «донорна» молекула як матриця для репарації молекули «мішені» (тобто молекули, яка піддалася двонитковому розриву) і такий процес відомий як «некросоверна конверсія генів» або «конверсія генів на коротких ділянках», оскільки він приводить до перенесення генетичної інформації від донора до мішені. Не маючи наміру бути пов'язаними з якою-небудь конкретною теорією, вважають, що таке перенесення може включати в себе корекцію помилкового спарювання в гетеродуплексі ДНК, який утворюється між розірваною мішенню і донором, і/або «залежний від синтезу відпал ниток», при якому донор використовується для повторного синтезу генетичної інформації, яка стане частиною мішені, і/або родинні процеси. Така спеціалізована HR часто приводить до зміни послідовності 10 UA 100505 C2 5 10 15 20 25 30 35 40 45 50 55 60 молекули мішені так, що частина або вся послідовність донорного полінуклеотиду включається в полінуклеотид-мішень. «Розщеплення» стосується розриву ковалентних зв'язків у кістяку молекули ДНК. Розщеплення може бути ініційоване різними способами, включаючи без обмеження ферментативний або хімічний гідроліз фосфодіефірного зв'язку. Можливі й однониткові і двониткові розриви, і двониткове розщеплення може відбуватися в результаті двох подій однониткового розщеплення. Розщеплення ДНК може приводити до утворення або тупих кінців, або «липких» кінців. У деяких варіантах використовують злиті поліпептиди для цілеспрямованого двониткового розщеплення ДНК. «Домен розщеплення» містить одну або декілька поліпептидних послідовностей і має каталітичну активність відносно розщеплення ДНК. Домен розщеплення може входити до складу одного поліпептидного ланцюга або розщеплювальна активність може бути результатом асоціації двох (або більше) поліпептидів. «Напівдомен розщеплення» являє собою поліпептидну послідовність, яка разом із другим поліпептидом (або таким же, або іншим) утворює комплекс, що має розщеплювальну активність (наприклад, активність в двонитковому розщепленні). Терміни «домен розщеплення» і «напівдомен розщеплення» включають домени дикого типу і частини або мутанти доменів розщеплення або напівдоменів розщеплення, які зберігають здатність мультимеризуватися (наприклад, димеризуватися) з утворенням функціонального домену розщеплення. «Хроматин» являє собою нуклеопротеїдну структуру, яка містить клітинний геном. Клітинний хроматин містить нуклеїнову кислоту, головним чином ДНК, і білок, включаючи гістони і негістонові хромосомні білки. Більша частина хроматину еукаріотичних клітин існує у формі нуклеосом, при цьому кор нуклеосоми містить приблизно 150 пар основ ДНК, асоційованих з октамером, що містить по два кожного з гістонів H2A, H2B, H3 і H4; і лінкерна ДНК (різні довжини залежно від організму) розташовується між нуклеосомними корами. Молекула гістону H1 звичайно асоційована з лінкерною ДНК. З метою даного опису мається на увазі, що термін «хроматин» охоплює всі типи клітинного нуклеопротеїду, як прокаріотичного, так і еукаріотичного. Клітинний хроматин включає як хромосомний, так і епісомний хроматин. «Хромосома» означає хроматиновий комплекс, що містить весь або частину геному клітини. Геном клітини часто характеризують каріотипом, який являє собою набір усіх хромосом, що містить геном клітини. Геном клітини може містити одну або декілька хромосом. «Епісома» являє собою нуклеїнову кислоту, що реплікується, нуклеопротеїдний комплекс або іншу структуру, що містить нуклеїнову кислоту, яка не є частиною хромосомного каріотипу клітини. Прикладами епісом є плазміди і деякі вірусні геноми. «Доступна область» означає ділянку клітинного хроматину, у якій сайт-мішень, присутній у нуклеїновій кислоті, може бути зв'язаний екзогенною молекулою, яка упізнає сайт-мішень. Не маючи наміру бути пов'язаними з якою-небудь конкретною теорією, вважають, що доступна область є областю, яка не упакована в нуклеосомну структуру. Окрему структуру доступної області часто можна виявити по її чутливості до хімічних і ферментативних зондів, наприклад, до нуклеаз. «Сайт-мішень» або «послідовність-мішень» являє собою послідовність нуклеїнової кислоти, що визначає частину нуклеїнової кислоти, з якою буде зв'язуватися зв’язувальна молекула, за умови, що існують достатні умови для зв'язування. Наприклад, послідовність 5'-GAATTC-3' є сайтом-мішенню для ендонуклеази рестрикції Eco RI. «Екзогенною» молекулою є молекула, яка у нормі не присутня в клітині, але може бути введена в клітину одним або декількома генетичними, біохімічними або іншими способами. «Присутність у клітині в нормі» визначають відносно конкретної стадії розвитку й умов навколишнього середовища для клітини. Таким чином, наприклад, молекула, яка присутня тільки під час ембріонального розвитку м'яза, є екзогенною молекулою для м'язової клітини в дорослому стані. Подібним чином молекула, індукована тепловим шоком, є екзогенною молекулою відносно не індукованої тепловим шоком клітини. Екзогенна молекула може містити, наприклад, функціонуючий варіант непрацюючої ендогенної молекули або непрацюючий варіант нормально функціонуючої ендогенної молекули. Екзогенна молекула поряд з іншими формами може являти собою малу молекулу, таку як молекула, створена способом комбінаторної хімії, або макромолекулу, таку як білок, нуклеїнова кислота, вуглевод, ліпід, глікопротеїд, ліпопротеїд, полісахарид, будь-яке модифіковане похідне зазначених вище молекул або будь-який комплекс, що містить одну або декілька зазначених вище молекул. Нуклеїнові кислоти включають ДНК і РНК, можуть бути одно- або двонитковими; можуть бути нерозгалуженими, розгалуженими або кільцевими; і можуть мати будь-яку 11 UA 100505 C2 5 10 15 20 25 30 35 40 45 50 55 60 довжину. Нуклеїнові кислоти включають такі нуклеїнові кислоти, які здатні утворювати дуплекси, а також нуклеїнові кислоти, які утворюють триплекси. Дивіться, наприклад, патенти США № 5176996 і 5422251. Білки включають без обмеження ДНК-зв’язувальні білки, транскрипційні фактори, фактори ремоделювання хроматину, білки, що зв'язують метильовану ДНК, полімерази, метилази, деметилази, ацетилази, деацетилази, кінази, фосфатази, інтегрази, рекомбінази, лігази, топоізомерази, гірази і гелікази. Екзогенна молекула може належати до того ж типу молекул, що й ендогенна молекула, наприклад, екзогенний білок або нуклеїнова кислота. Наприклад, екзогенна нуклеїнова кислота може містити геном інфікуючого вірусу, T-нитку Agrobacterium tumefacians, плазміду або епісому, введені в клітину, або хромосому, яка у нормі не присутня в клітині. Однак екзогенні нуклеїнові кислоти або полінуклеотиди можуть містити послідовності, які є гомологічними або ідентичними ендогенним послідовностям. Що стосується конкретної ендогенної області геному, те «екзогенна послідовність» належить до нуклеотидної послідовності, яка не присутня у даній області. Така екзогенна послідовність може бути присутньою в іншому положенні ендогенної хромосоми або вона може взагалі бути відсутньою у геномі. Таким чином, екзогенний полінуклеотид може містити як екзогенні, так і ендогенні послідовності: наприклад, трансген, фланкований послідовностями, гомологічними області геному. Такі екзогенні нуклеїнові кислоти використовують у способах цілеспрямованої інтеграції і цілеспрямованої рекомбінації, які описані нижче. Способи введення екзогенних молекул у клітини відомі фахівцям у даній галузі і включають без обмеження опосередковане ліпідами перенесення (тобто ліпосоми, що містять нейтральні і катіонні ліпіди), електропорацію, пряму ін'єкцію, злиття клітин, бомбардування частинками, копреципітацію фосфатом кальцію, опосередковане DEAE-декстраном перенесення і перенесення, опосередковане вірусними векторами. Навпаки, «ендогенна» молекула є молекулою, яка у нормі присутня в конкретній клітині на конкретній стадії розвитку в конкретних умовах навколишнього середовища. Наприклад, ендогенна нуклеїнова кислота може включати в себе хромосому, геном мітохондрії, хлоропласта або іншого органоїда або епісомну нуклеїнову кислоту, що зустрічається в природі. Додаткові ендогенні молекули можуть включати в себе білки, наприклад, фактори транскрипції і ферменти. «Злита» молекула є молекулою, в якій зв'язані дві або більше молекул-субодиниць, наприклад, ковалентно. Субодиничні молекули можуть являти собою молекули того самого хімічного типу або можуть бути молекулами різних хімічних типів. Прикладами злитої молекули першого типу є без обмеження злиті білки (наприклад, злиття між ДНК-зв’язувальним доменом ZFP і доменом розщеплення) і злиті нуклеїнові кислоти (наприклад, нуклеїнова кислота, яка кодує злитий білок, описаний вище). Приклади злитої молекули другого типу включають без обмеження злиття між нуклеїновою кислотою, що утворює триплекс, і поліпептидом, і злиття між агентом, що зв'язує малу борозенку, і нуклеїновою кислотою. Експресія злитого білка в клітині може бути результатом доставки злитого білка в клітину або доставки полінуклеотиду, що кодує злитий білок, у клітину, де полінуклеотид транскрибується, і транскрипт транслюється з утворенням злитого білка. Транс-сплайсинг, розщеплення поліпептиду і лігування поліпептидів також можуть бути залучені в експресію білка в клітині. Способи доставки полінуклеотидів і поліпептидів у клітини описані далі в даному описі. Термін «ген» з метою даного опису включає область ДНК, яка кодує генний продукт (дивіться нижче), а також області ДНК, які регулюють продукцію генного продукту, незалежно від того, чи є такі регуляторні послідовності прилеглими відносно кодуючих і/або транскрибованих послідовностей. Відповідно, ген включає в себе, але не обов'язково обмежений ними, промоторні послідовності, термінатори, послідовності регуляції трансляції, такі як сайти зв'язування рибосом і внутрішні сайти зв'язування рибосом, енхансери, сайленсери, інсулятори, пограничні елементи, начала реплікації, ділянки зв'язування з матриксом і області регуляції локусу. «Генна експресія» стосується перетворення інформації, що знаходиться в гені, у генний продукт. Генний продукт може бути безпосереднім продуктом транскрипції гена (наприклад, мРНК, тРНК, рРНК, антисмислова РНК, рибозим, структурна РНК або будь-який інший тип РНК) або білком, утвореним при трансляції мРНК. Генні продукти також включають РНК, які модифіковані в результаті таких процесів, як кепування, поліаденілюваня, метилування і редагування, і білки, модифіковані, наприклад, метилуванням, ацетилуванням, фосфорилуванням, убіквітинуванням, АДФ-рибозилюванням, міристилюванням і глікозилюванням. «Модулювання» генної експресії стосується зміни активності гена. Модулювання експресії може включати в себе без обмеження активацію гена і репресію гена. 12 UA 100505 C2 5 10 15 20 25 30 35 40 45 50 55 60 «Рослинні» клітини включають без обмеження клітини однодольних (односім'ядольних) або дводольних (двосім'ядольних) рослин. Необмежувальні приклади однодольних рослин включають сільськогосподарські рослини, такі як маїс, рис, ячмінь, овес, пшениця, сорго, жито, цукрова тростина, ананас, цибуля, банан і кокос. Необмежувальними прикладами дводольних є тютюн, томат, соняшник, бавовна, цукровий буряк, картопля, латук, диня, канола (рапс) і люцерна. Рослинні клітини можуть бути з будь-якої частини рослини і/або будь-якої стадії розвитку рослини. Термін «область, що представляє інтерес», означає будь-яку область клітинного хроматину, таку як, наприклад, ген або некодуюча послідовність у гені або поблизу гена, у якій потрібно зв'язати екзогенну молекулу. Зв'язування може бути здійснене для цілеспрямованого розщеплення ДНК і/або цілеспрямованої рекомбінації. Область, що представляє інтерес, може бути присутньою у хромосомі, епісомі, геномі органоїда (наприклад, мітохондрії, хлоропласта) або, наприклад, у геномі інфікуючого вірусу. Область, що представляє інтерес, може знаходитися в кодуючій області гена, у транскрибованих некодуючих областях, таких як, наприклад, лідерні послідовності, трейлерні послідовності або інтрони, або в нетранскрибованих областях, або вище, або нижче кодучої області. Область, що представляє інтерес, може мати найменшу довжину в одну нуклеотидну пару або довжину до 25000 пар нуклеотидів, або будь-яке ціле число пар нуклеотидів. Терміни «оперативне зв'язування» і «оперативно зв'язаний» використовують взаємозамінно стосовно взаємного положення двох або більше компонентів (таких як елементи послідовності), при якому компоненти розташовані так, що обидва компоненти нормально функціонують і забезпечують можливість того, що щонайменше один з компонентів може опосередковувати функцію, на яку впливає щонайменше один з інших компонентів. З метою ілюстрації послідовність регуляції транскрипції, така як промотор, оперативно зв'язана з кодуючою послідовністю, якщо послідовність регуляції транскрипції регулює рівень транскрипції кодуючої послідовності у відповідь на присутність або відсутність одного або декількох факторів регуляції транскрипції. Послідовність регуляції транскрипції звичайно оперативно зв'язана в цисположенні з кодуючою послідовністю, але не обов'язково знаходиться в безпосередній близькості з нею. Наприклад, енхансер являє собою послідовність регуляції транскрипції, яка оперативно зв'язана з кодуючою послідовністю, хоча вони не є сусідніми. Що стосується злитих поліпептидів, то термін «оперативно зв'язаний» може стосуватися того факту, що кожний з компонентів здійснює ту саму функцію, знаходячись у зв'язку з іншим компонентом, так само як він виконував би її, будучи не зв'язаним з ним. Наприклад, відносно злитого поліпептиду, у якому ДНК-зв’язувальний домен ZFP злитий з доменом розщеплення, ДНК-зв'язувальний домен ZFP і домен розщеплення знаходяться в оперативному зв'язку, якщо в злитому поліпептиді частина, представлена ДНК-зв’язувальним доменом ZFP, здатна зв'язувати сайт-мішень і/або сайт-зв’язування, тоді як домен розщеплення здатний розщеплювати ДНК поблизу сайта-мішені. «Функціональний фрагмент» білка, поліпептиду або нуклеїнової кислоти являє собою білок, поліпептид або нуклеїнову кислоту, послідовність яких не ідентична до повнорозмірного білка, поліпептиду або нуклеїнової кислоті, але все ще зберігає таку ж функцію, як і повнорозмірний білок, поліпептид або нуклеїнова кислота. Функціональний фрагмент може мати більше, менше або таку ж кількість залишків, як і відповідна нативна молекула, і/або може містити одну або декілька амінокислотних або нуклеотидних замін. Способи визначення функції нуклеїнової кислоти (наприклад, кодуючої функції, здатності гібридизуватися з іншою нуклеїновою кислотою) добре відомі в даній галузі. Подібним чином добре відомі способи визначення функції білка. Наприклад, ДНК-зв'язувальну функцію поліпептиду можна визначити, наприклад, зв'язуванням на фільтрі, по зсуву електрофоретичної рухливості або в аналізах імунопреципітації. Розщеплення ДНК можна оцінити з використанням гель-електрофорезу. Дивіться Ausubel et al., вище. Здатність білка взаємодіяти з іншим білком можна визначити, наприклад, спільною імунопреципітацією, аналізом двогібридної системи або аналізом комплементації, як генетичної, так і біохімічної. Дивіться, наприклад, Fields et al. (1989) Nature 340: 245-246; патент США № 5585245 і PCT WO 98/44350. Зв’язувальні домени типу цинкових пальців У даній публікації описані неканонічні зв’язувальні домени типу цинкових пальців і полінуклеотиди, що кодують такі зв’язувальні домени типу цинкових пальців. У деяких варіантах неканонічні зв’язувальні домени типу цинкових пальців, описані в даній публікації, являють собою цинкові пальці C3H, у яких один із двох консервативних координуючих цинк залишків гістидину перетворений у цистеїн. У додаткових варіантах найближчий до C-кінця залишок гістидину перетворений у залишок цистеїну з утворенням «білка CCHC». 13 UA 100505 C2 5 10 15 20 25 30 35 40 45 50 55 Зв’язувальний домен типу цинкового пальця може містити один або декілька цинкових пальців (наприклад, 2, 3, 4, 5, 6, 7, 8, 9 або більше цинкових пальців) і він може бути сконструйований для зв'язування з будь-якою послідовністю-мішенню (наприклад геномною послідовністю). Зв’язувальні домени типу цинкових пальців можуть зв'язуватися з ДНК, РНК і/або білком. Звичайно один домен типу цинкового пальця має довжину приблизно 30 амінокислот. Цинкові пальці включають як канонічні C2H2-цинкові пальці (тобто цинкові пальці, в яких іон цинку координований двома залишками цистеїну і двома залишками гістидину), так і неканонічні цинкові пальці, такі як, наприклад, C3H-цинкові пальці (цинкові пальці, в яких іон цинку координований трьома залишками цистеїну й одним залишком гістидину). Також дивіться заявки на видачу патенту США № 20030108880, 20060246567 і 20060246588, описи яких включені у вигляді посилання. Структурні дослідження показали, що канонічний домен (мотив) типу цинкового пальця містить два бета-шари (утримуваних у бета-складці, яка містить два постійних залишки цистеїну) і альфа-спіраль (яка містить два постійних залишки гістидину), що утримуються в конкретній конформації за допомогою координування атома цинку двома цистеїнами і двома гістидинами. Неканонічні цинкові пальці, описані в даній публікації, зберігають таку бета-бетаальфа-структуру. Неканонічні цинкові пальці, описані в даній публікації, можуть являти собою зв’язувальні домени типу цинкових пальців, що зустрічаються в природі. Однак більш типово неканонічні цинкові пальці, описані в даній публікації, містять один або декілька компонентів цинкових пальців, в яких щонайменше один з координуючих цинк залишків цистеїну або гістидину був замінений однією або декількома амінокислотами. Наприклад, у деяких варіантах C-кінцевий залишок His зв’язувального модуля канонічного цинкового пальця замінений залишком Cys. Цинкові пальці CCHC, описані в даній публікації, також можуть містити одну або декілька змін (у порівнянні з послідовністю цинкового пальця C2H2, що зустрічається в природі) у послідовності амінокислотних залишків, відмінній від координуючих цинк залишків. Такі зміни можуть включати в себе заміни, делеції і/або інсерції. Амінокислоти можуть бути змінені в будьякому положенні в цинковому пальці. Необмежувальними прикладами змін є: (1) заміни одиночних залишків, що оточують змінений координуючий цинк залишок; (2) додавання додаткових залишків до або після зміненого координуючого цинк залишку (наприклад, у тих випадках, у яких найближчий до C-кінця залишок His перетворений у Cys, додавання додаткових амінокислот може полегшувати координацію цинку за допомогою компенсування більш короткого бічного ланцюга цистеїну); і/або (3) заміна залишків, розташованих між залишками His і Cys цинкового пальця CCHC, що зустрічається в природі, у відповідну область неканонічного цинкового пальця CCHC. У деяких варіантах білки з цинковими пальцями, описані в даній публікації, містять щонайменше один цинковий палець, що містить неканонічний (не-C2H2) цинковий палець, при цьому неканонічний цинковий палець має спіральну частину, залучену в зв'язування ДНК, і координуюча цинк область спіральної частини містить амінокислотну послідовність HX1X2RCXL (SEQ ID NO: 2); і при цьому білок з цинковими пальцями сконструйований для зв'язування послідовності-мішені. У деяких варіанті X1 означає A або K, або T; X2 означає Q або E, або R; і XL означає G. В інших варіантах неканонічні цинкові пальці, описані в даній публікації, мають загальну A B C D A B C D структуру: Cys-(X )2-4-Cys-(X )12-His-(X )3-5-Cys-(X )1-10 (SEQ ID NO: 3), де X , X , X і X C означають будь-яку амінокислоту. У варіантах, у яких X містить 3 залишки, (i) щонайменше D один з таких залишків змінений у порівнянні з канонічним цинковим пальцем CCHC; і/або (ii) X містить щонайменше одну делецію, заміну або інсерцію в порівнянні з канонічним цинковим D пальцем CCHH. У деяких варіантах X містить послідовність QLV або QKP. В інших варіантах D X містить один або декілька (наприклад 1, 2, 3, 4, 5, 6, 7, 8, 9 або 10) залишків Gly (G). Неповні амінокислотні послідовності (включаючи і C-кінцеву відносно третього координуючого цинк залишку) типових неканонічних цинкових пальців показані в таблиці 1, 2, 3 і 4. В усіх таблицях два найближчих до C-кінця (тобто третій і четвертий) координуючих цинк залишки (H і C) підкреслені. Зміни (наприклад, заміни, інсерції, делеції) у порівнянні з послідовністю неканонічного пальця «дикого типу» (ряд 2 у таблицях 1 і 3) показані підкресленням двома рисками. 14 UA 100505 C2 Таблиця 1 15 UA 100505 C2 Таблиця 2 16 UA 100505 C2 Таблиця 3 17 UA 100505 C2 Таблиця 4 5 10 15 20 25 30 35 40 45 Як зазначено вище, ZFP може містити будь-яку кількість зв’язувальних доменів типу цинкових пальців, наприклад, щонайменше 3 цинкових пальці. Крім того, один, декілька або всі цинкові пальці можуть являти собою неканонічні цинкові пальці, які описані в даній публікації. У деяких варіантах найближчий до C-кінця палець багатопальцевого білка з цинковими пальцями являє собою канонічний цинковий палець. В інших варіантах найближчий до C-кінця палець багатопальцевого білка з цинковими пальцями являє собою палець CCHC, що описаний у даній публікації, наприклад, палець CCHC, який містить одну або декілька амінокислотних інсерцій, C-кінцевих відносно найближчого до C-кінця координуючого цинк залишку Cys. Дивіться приклади 1-5, у яких описані 4-пальцеві білки з цинковими пальцями, у яких палець 2 (F2) і/або палець 4 (F4) є неканонічними цинковими пальцями, які описані в даній публікації. Зв’язувальні домени типу цинкових пальців можуть бути сконструйовані для зв'язування з вибраною послідовністю. Дивіться, наприклад, Beerli et al. (2002) Nature Biotechnol. 20: 135-141; Pabo et al. (2001) Ann. Rev. Biochem. 70: 313-340; Isalan et al. (2001) Nature Biotechnol. 19: 656660; Segal et al. (2001) Curr. Opin. Biotechnol. 12: 632-637; Choo et al. (2000) Curr. Opin. Struct. Biol. 10: 411-416. Сконструйований зв’язувальний домен типу цинкового пальця може мати нову специфічність зв'язування в порівнянні з білком з цинковими пальцями, що зустрічається в природі. Способи конструювання включають без обмеження конструктивну розробку і різні типи селекції (тобто способи, в яких проводять скринінг множини різних послідовностей цинкових пальців проти однієї нуклеотидної послідовності-мішені). Конструктивна розробка включає, наприклад, використання баз даних, що містять триплетні (або квадруплетні) нуклеотидні послідовності й окремі амінокислотні послідовності цинкових пальців, у яких кожна триплетна або квадруплетна нуклеотидна послідовність асоційована з однією або декількома амінокислотними послідовностями цинкових пальців, які зв'язують конкретну триплетну або квадруплетну послідовність. Дивіться, наприклад, патенти США тих же авторів № 6453242 і 6534261. Додаткові способи конструктивної розробки описані, наприклад, у патентах США № 6746838, 6785613, 6866997 і 7030215. Підвищення специфічності зв'язування зв’язувальних доменів типу цинкових пальців описане, наприклад, у патенті США тих же авторів № 6794136. Зразкові способи відбору, включаючи фаговий дисплей і двогібридні системи, описані в патентах США № 5789538, 5925523, 6007988, 6013453, 6410248, 6140466, 6200759 і 6242568, а також у WO 98/37186, WO 98/53057, WO 00/27878, WO 01/88197 і GB 2338237. Оскільки окремий цинковий палець зв'язується з тринуклеотидною послідовністю (тобто триплетом) (або чотиринуклеотидною послідовністю, яка може перекриватися одним нуклеотидом з чотиринуклеотидним сайтом зв'язування сусіднього цинкового пальця), то довжина послідовності, для зв'язування з якою конструюють зв’язувальний домен типу цинкового пальця (наприклад, послідовність-мішень), буде визначати кількість цинкових пальців у сконструйованому зв’язувальному домені типу цинкового пальця. Наприклад, у випадку ZFP, у яких мотиви цинкових пальців не зв'язуються з підсайтами, що перекриваються, шестинуклеотидна послідовність-мішень зв'язується двопальцевим зв’язувальним доменом; дев’ятинуклеотидна послідовність-мішень зв'язується трипальцевим зв’язувальним доменом і т. д. Сайти зв'язування для окремих цинкових пальців (тобто підсайти) у сайті-мішені не повинні бути сусідніми, а можуть бути розділені одним або декількома нуклеотидами, залежно від довжини і природи амінокислотних послідовностей між цинковими пальцями (тобто міжпальцевих лінкерів) у багатопальцевому зв’язувальному домені. Дивіться, наприклад, патенти США № 6479626, 6903185 і 7153949 і публікацію заявки на видачу патенту США № 2003/0119023; описи яких включені у вигляді посилання. У багатопальцевому зв’язувальному домені типу цинкового пальця, сусідні цинкові пальці можуть бути розділені амінокислотними лінкерними послідовностями довжиною приблизно 5 амінокислот (так звані «канонічні» міжпальцеві лінкери) або, альтернативно, одним або 18 UA 100505 C2 5 10 15 20 25 30 35 40 45 50 55 декількома неканонічними лінкерами. Дивіться, наприклад, патенти США тих же авторів № 6453242 і 6534261. У випадку сконструйованих зв’язувальних доменів типу цинкових пальців, що містять більше трьох пальців, інсерція більш довгих («неканонічних») міжпальцевих лінкерних послідовностей між деякими цинковими пальцями може збільшувати афінність і/або специфічність зв'язування зв’язувальним доменом. Дивіться, наприклад, патент США № 6479626 і публікацію заявки на видачу патенту США № 2003/0119023; описи яких включені у вигляді посилання. Відповідно, багатопальцеві зв’язувальні домени типу цинкових пальців також можуть бути охарактеризовані відносно наявності і положення неканонічних міжпальцевих лінкерів. Використання більш довгих міжпальцевих лінкерів також може полегшувати зв'язування білка з цинковими пальцями із сайтами-мішенями, які містять несусідні нуклеотиди. В результаті, один або декілька підсайтів у сайті-мішені для зв’язувального домену типу цинкового пальця можуть бути відділені один від одного 1, 2, 3, 4, 5 або більше нуклеотидами. Як один приклад, чотирипальцевий зв’язувальний домен може зв'язуватися з 13нуклеотидним сайтом-мішенню, який містить розташовані послідовно два сусідніх 3нуклеотидних підсайти, проміжний нуклеотид і два сусідніх триплетних підсайти. Підсайт-мішень являє собою нуклеотидну послідовність (звичайно з 3 або 4 нуклеотидів), яка зв'язується одним цинковим пальцем. Однак у випадку сайта-мішені не обов'язково, щоб він являв собою множину триплетів, що складаються з трьох нуклеотидів. Наприклад, у тих випадках, коли відбуваються взаємодії, що зачіпають обидві нитки (дивіться, наприклад, патенти США № 6453242 і 6794136), один або декілька окремих цинкових пальців багатопальцевого зв’язувального домену можуть зв'язуватися з квадруплетними підсайтами, що перекриваються. Дивіться також патенти США № 6746838 і 6866997. Як один з прикладів трипальцевий зв’язувальний домен може зв'язуватися з 10-нуклеотидним сайтом-мішенню, який містить три 4-нуклеотидних підсайти, що перекриваються. Відбір послідовності в клітинному хроматині для зв'язування доменом типу цинкового пальця (наприклад, сайта-мішені) можна здійснити, наприклад, відповідно до способів, розкритих у патенті США того ж автора № 6453242 (17 вересня, 2002), у якому також описані способи конструювання ZFP для зв'язування з вибраною послідовністю. Фахівцям у даній галузі буде зрозуміло, що простий візуальний перегляд нуклеотидної послідовності також можна використовувати для відбору сайта-мішені. Відповідно, в описаних у даній публікації способах можна використовувати будь-які способи відбору сайта-мішені. Багатопальцевий білок з цинковими пальцями може бути сконструйований зв'язуванням окремих одержаних цинкових пальців, наприклад, за допомогою конструювання або селекції. Альтернативно зв’язувальні модулі, що складаються з двох цинкових пальців, можуть бути зв'язані один з одним з використанням або канонічних, або більш довгих неканонічних міжпальцевих лінкерів (дивіться вище) з утворенням чотирипальцевих і шестипальцевих білків. Такі двопальцеві модулі можуть бути одержані, наприклад, у результаті відбору двох прилеглих пальців, які зв'язують конкретну шестинуклеотидну послідовність-мішень, у контексті багатопальцевого білка (звичайно три пальці). Дивіться, наприклад, WO 98/53057 і публікацію заявки на видачу патенту США № 20030119023; описи яких включені у вигляді посилання. Альтернативно двопальцеві модулі можуть бути сконструйовані в результаті збирання окремих цинкових пальців. Таким чином, домени типу цинкових пальців, описані в даній публікації, можуть бути використані по окремості або в різних сполученнях для конструювання багатопальцевих білків з цинковими пальцями, які зв'язують який-небудь сайт-мішень. Відстань між послідовностями (наприклад, сайтами-мішенями) стосується визначеної кількості нуклеотидів або пар нуклеотидів, у проміжку між двома послідовностями, яку вимірюють від кінців послідовностей, найближчих одна до одної. У варіантах з використанням ZFN, наприклад, у яких розщеплення залежить від зв'язування двох злитих молекул домен типу цинкового пальця/напівдомен розщеплення, для того, щоб розділити сайти-мішені, два сайти-мішені можуть розташовуватися на протилежних нитках ДНК. В інших варіантах обидва сайти-мішені знаходяться на одній і тій же нитці ДНК. Дивіться, наприклад, WO 2005/084190; опис якої включений у вигляді посилання. Полінуклеотиди, що кодують цинкові пальці або білки з цинковими пальцями, також входять в обсяг даного опису. Такі полінуклеотиди можуть бути сконструйовані з використанням стандартних методик і вбудовані у вектор, і вектор може бути введений у клітину (нижче дивіться додатковий опис, що стосується векторів і способів введення полінуклеотидів у клітини) так, щоб кодований білок експресувався в клітині. Злиті білки 19 UA 100505 C2 5 10 15 20 25 30 35 40 45 50 55 60 Також пропонуються злиті білки, що містять один або декілька компонентів у вигляді неканонічних цинкових пальців, описаних у даній публікації. Злиті молекули конструюють способами клонування і біохімічної кон'югації, які добре відомі фахівцям у даній галузі. Злиті молекули містять CCHC-вмісний ZFP і, наприклад, домен розщеплення, напівдомен розщеплення, домен активації транскрипції, домен репресії транскрипції, компонент комплексу ремоделювання хроматину, інсуляторний домен, функціональний фрагмент кожного з зазначених доменів і/або будь-які сполучення двох або більше функціональних доменів або їх фрагментів. У деяких варіантах злиті молекули містять модифікований рослинний білок з цинковими пальцями і щонайменше два функціональних домени (наприклад, інсуляторний домен або домен метилзв’язувального білка і, додатково, домен активації або репресії транскрипції). Злиті молекули також необов'язково містять сигнал ядерної локалізації (такий як, наприклад, сигнал з T-антигену SV40 або NLS Opaque-2 маїсу) і епітопну мітку (таку як, наприклад, FLAG або гемаглютинін). Злиті білки (і кодуючі їх нуклеїнові кислоти) конструюють так, щоб рамка зчитування при трансляції була збережена для компонентів злиття. Способи проектування і конструювання злитих білків (і кодуючих їх полінуклеотидів) відомі фахівцям у даній галузі. Наприклад, способи проектування і конструювання злитого білка, який містить білки цинкових пальців (і кодуючих їх полінуклеотидів), описані в патентах США тих же авторів № 6453242 і 6534261. Полінуклеотиди, що кодують такі злиті білки, також входять в обсяг даного опису. Такі полінуклеотиди можуть бути сконструйовані з використанням стандартних методик і вбудовані у вектор, і вектор може бути введений у клітину (дивіться нижче додатковий опис, що стосується векторів і способів введення полінуклеотидів у клітини). Прикладом функціонального домену для злиття з ДНК-зв’язувальним доменом ZFP, використовуваним для репресії експресії гена, є домен репресії KRAB з білка KOX-1 людини (дивіться, наприклад, Thiesen et al., New Biologist 2, 363-374 (1990); Margolin et al., Proc. Natl. Acad. Sci. USA 91, 4509-4513 (1994); Pengue et al., Nucl. Acids Res. 22: 2908-2914 (1994); Witzgall et al., Proc. Natl. Acad. Sci. USA 91, 4514- 4518 (1994). Домен KOX також придатний для застосування як домену репресії. Іншим придатним доменом репресії є метилзв’язувальний домен білка 2B (MBD-2B) (дивіться, також Hendrich et al. (1999) Mamm. Genome 10: 906-912, де описані білки MBD). Іншим застосовним доменом репресії є домен, асоційований з білком vErbА. Дивіться, наприклад, Damm, et al. (1989) Nature 339: 593-597; Evans (1989) Int. J. Cancer Suppl. 4: 26-28; Pain et al. (1990) New Biol. 2: 284-294; Sap et al. (1989) Nature 340: 242-244; Zenke et al. (1988) Cell 52: 107-119; і Zenke et al. (1990) Cell 61: 1035-1049. Додаткові приклади доменів репресії включають без обмеження рецептор тиреоїдного гормону (TR), SID, MBD1, MBD2, MBD3, MBD4, MBD-подібні білки, члени сімейства DNMT (наприклад DNMT1, DNMT3A, DNMT3B), Rb, MeCP1 і MeCP2. Дивіться, наприклад, Zhang et al. (2000) Ann. Rev. Physiol. 62: 439-466; Bird et al. (1999) Cell 99: 451-454; Tyler et al. (1999) Cell 99: 443-446; Knoepfler et al. (1999) Cell 99: 447-450; і Robertson et al. (2000) Nature Genet. 25: 338-342. Додаткові приклади доменів репресії включають без обмеження, ROM2 і AtHD2A. Дивіться, наприклад, Chern et al. (1996) Plant Cell 8: 305-321 і Wu et al. (2000) Plant J. 22: 19-27. Придатні домени для досягнення активації включають домен активації VP16 HSV (дивіться, наприклад, Hagmann et al., J. Virol. 71, 5952-5962 (1997)); ядерні рецептори гормонів (дивіться, наприклад, Torchia et al., Curr. Opin. Cell. Biol. 10: 373-383 (1998)); субодиницю p65 ядерного фактора каппа B (Bitko and Bank, J. Virol. 72: 5610-5618 (1998) і Doyle and Hunt, Neuroreport 8: 2937-2942 (1997); Liu et al., Cancer Gene Ther. 5: 3-28 (1998)) або штучні химерні функціональні домени, такі як VP64 (Seifpal et al., EMBO J. 11, 4961-4968 (1992)). Додаткові приклади доменів активації включають без обмеження p300, CBP, PCAF, SRC1, PvALF і ERF-2. Дивіться, наприклад, Robyr et al. (2000) MoI. Endocrinol. 14:329-347; Collingwood et al. (1999) J. MoI. Endocrinol. 23:255-275; Leo et al. (2000) Gene 245:1-11; ManteuffelCymborowska (1999) Acta Biochim. Pol. 46:77-89; McKenna et al. (1999) J. Steroid Biochem. Mol. Biol. 69:3-12; Malik et al. (2000) Trends Biochem. Sci 25:277-283 і Lemon et al. (1999) Curr. Opin. Genet. Dev. 9:499-504. Додаткові приклади доменів активації включають без обмеження OsGAI, HALF-1, C1, AP1, ARF-5, -6, -7 і -8, CPRF1, CPRF4, MYC-RP/GP і TRAB1. Дивіться, наприклад, Ogawa et al. (2000) Gene 245:21-29; Okanami et al. (1996) Genes Cells 1:87-99; Goff et al. (1991) Genes Dev. 5:298-309; Cho et al. (1999) Plant Mol. Biol. 40:419-429; Ulmason et al. (1999) Proc. Natl. Acad. Sci. USA 96:5844-5849; Sprenger-Haussels et al. (2000) Plant J. 22:1-8; Gong et al. (1999) Plant MoI. Biol. 41:33-44 і Hobo et al. (1999) Proc. Natl. Acad. Sci. USA 96:15,348-15,353. Додаткові функціональні домени розкриті, наприклад, у патенті США тих же авторів № 6933113. Крім того, інсуляторні домени, білки ремоделювання хроматину, такі як ISWI-вмісні 20 UA 100505 C2 5 10 15 20 25 30 35 40 45 50 55 60 домени, і білки з метилзв’язувальними доменами, придатні для використання в злитих молекулах, описані, наприклад, у міжнародних публікаціях тих же авторів WO 01/83793 і WO 02/26960. В інших варіантах злитий білок являє собою нуклеазу з цинковими пальцями (ZFN), яка містить один або декілька цинкових пальців CCHC, що описані в даній публікації, і домен розщеплення (або напівдомен розщеплення). Цинкові пальці можуть бути сконструйовані так, щоб вони упізнавали послідовність-мішень у будь-якій вибраній області геному і при введенні в клітину приводили до зв'язування злитого білка (білків) із сайтом (сайтами) його зв'язування і розщеплення в межах або поблизу зазначеної області геному. Таке розщеплення може приводити до зміни нуклеотидної послідовності в області геному (наприклад, до мутації) після з’єднування негомологічних кінців. Альтернативно, якщо в такій клітині також присутній екзогенний полінуклеотид, що містить послідовності, гомологічні області геному, то з високою частотою відбувається гомологічна рекомбінація між областю геному й екзогенним полінуклеотидом після цілеспрямованого розщеплення під дією ZFN. Гомологічна рекомбінація може приводити до цілеспрямованої заміни послідовностей або цілеспрямованої інтеграції екзогенних послідовностей, залежно від нуклеотидної послідовності екзогенного полінуклеотиду. Неканонічні цинкові пальці, описані в даній публікації, забезпечують поліпшену функцію розщеплення при включенні в ZFN. Як описано в прикладах, 4-пальцеві ZFN, що містять щонайменше один палець CCHC, який описаний у даній публікації, розщеплюють щонайменше так само, як нуклеази, що містять тільки пальці CCHH. У деяких варіантах у тих випадках, коли C-кінцевий палець містить неканонічний цинковий палець CCHC, залишки між третім і четвертим координуючими цинк залишками (тобто між C-кінцевими залишками His і Cys) відрізняються від залишків, присутніх у канонічному цинковому пальці CCHH, і один або декілька залишків гліцину (наприклад 1, 2, 3, 4, 5 або більше) вбудовані після C-кінцевого залишку Cys. Частина домену розщеплення в ZFN, описаних у даній публікації, може бути одержана з будь-якої ендонуклеази або екзонуклеази. Приклади ендонуклеаз, з яких може бути одержаний домен розщеплення, включають без обмеження ендонуклеази рестрикції і хомінг-ендонуклеази. Дивіться, наприклад, 2002-2003 Catalogue, New England Biolabs, Beverly, MA; і Belfort et al. (1997) Nucleic Acids Res. 25: 3379-3388. Відомі додаткові ферменти, які розщеплюють ДНК (наприклад, нуклеаза S1; нуклеаза квасолі золотавої; панкреатична ДНКаза I; мікрококова нуклеаза; ендонуклеаза HO дріжджів; дивіться також Linn et al. (eds.) Nucleases, Cold Spring Harbor Laboratory Press, 1993). Один або декілька таких ферментів (або їх функціональних фрагментів) можуть бути використані як джерело доменів розщеплення і напівдоменів розщеплення. Подібним чином, напівдомен розщеплення може бути одержаний з будь-якої нуклеази або її частини, що зазначені вище, за умови, що напівдомен розщеплення вимагає димеризації для розщеплювальної активності. Загалом, вимагаються два злитих білки для цілеспрямованого розщеплення геномної ДНК, якщо злиті білки містять напівдомени розщеплення. Альтернативно можна використовувати один білок, який містить два напівдомени розщеплення. Два напівдомени розщеплення можуть бути одержані з однієї і тієї ж ендонуклеази або напівдомени розщеплення можуть бути одержані з різних ендонуклеаз. Крім того, сайти-мішені для двох злитих білків розташовані один відносно одного так, що зв'язування двох злитих білків з їх відповідними сайтами-мішенями поміщає напівдомени розщеплення в такій просторовій орієнтації один відносно одного, яка дозволяє напівдоменам розщеплення утворювати функціональний домен розщеплення, наприклад, за допомогою димеризації. Таким чином, у деяких варіантах прилеглі границі сайтів-мишеней розділені 5-8 нуклеотидними парами або 1518 нуклеотидними парами. У додаткових варіантах сайти-мішені знаходяться в межах десяти пар нуклеотидів один від одного. Однак будь-яке ціле число або пара нуклеотидів можуть бути вбудовані між двома сайтами-мішенями (наприклад від 2 до 50 нуклеотидів або більше). Загалом, точка розщеплення лежить між сайтами-мішенями. Ендонуклеази рестрикції (ферменти рестрикції) є у багатьох видів, і вони здатні до специфічного для послідовності зв'язування з ДНК (у сайті упізнавання) і розщеплення ДНК у сайті зв'язування або поблизу нього. Деякі рестрикційні ферменти (наприклад, типу IIS) розщеплюють ДНК у сайтах, віддалених від сайта упізнавання, і мають окремі домени зв'язування і розщеплення. Наприклад, фермент типу IIS FokI каталізує двониткове розщеплення ДНК у межах 9 нуклеотидів від сайта упізнавання на одній нитці і 13 нуклеотидів від сайта упізнавання на іншій нитці. Дивіться, наприклад, патенти США № 5356802, 5436150 і 5487994; а також Li et al. (1992) Proc. Natl. Acad. Sci. USA 89: 4275-4279; Li et al. (1993) Proc. 21 UA 100505 C2 5 10 15 20 25 30 35 40 45 50 55 60 Natl. Acad. Sci. USA 90: 2764-2768; Kim et al. (1994a) Proc. Natl. Acad. Sci. USA 91: 883-887; Kim et al. (1994b) J. Biol. Chem. 269: 31978-31982. Таким чином, в одному варіанті злиті білки містять домен розщеплення (або напівдомен розщеплення) щонайменше з одного ферменту рестрикції типу IIS і один або декілька зв’язувальних доменів типу цинкового пальця, які можуть бути сконструйованими або природними. Прикладом ферменту рестрикції типу IIS, домен розщеплення якого може відокремлюватися від зв’язувального домену, є FokI. Зазначений конкретний фермент є активним у вигляді димеру. Bitinaite et al. (1998) Proc. Natl. Acad. Sci. USA 95: 10570-10575. Відповідно, з метою даного опису частина ферменту FokI, використовувана в описаних злитих білках, вважається напівдоменом розщеплення. Таким чином, для цілеспрямованого двониткового розщеплення і/або цілеспрямованої заміни клітинних послідовностей з використанням ZFN, що містять злиття цинковий палець-FokI, можна використовувати два злитих білки, кожний з який містить напівдомен розщеплення FokI, для реконструювання каталітично активного домену розщеплення. Альтернативно також можна використовувати одну поліпептидну молекулу, яка містить зв’язувальний домен типу цинкового пальця і два напівдомени розщеплення FokI. Параметри цілеспрямованого розщеплення і цілеспрямованої зміни послідовностей з використанням злиттів цинковий палець-FokI наведені в даному описі і, наприклад, у публікації заявки на видачу патенту США № 2005/0064474, опис якої включений у вигляді посилання. Структура також свідчить про те, що амінокислотні залишки в положеннях 446, 447, 479, 483, 484, 486, 487, 490, 491, 496, 498, 499, 500, 531, 534, 537 і 538 є досить близько розташованими до поверхні контакту при димеризації, щоб впливати на димеризацію. Відповідно, зміни амінокислотної послідовності в одному або декількох зазначених вище положеннях ймовірно будуть змінювати димеризаційні властивості напівдомену розщеплення. Такі зміни можуть бути внесені, наприклад, за допомогою конструювання бібліотеки, яка містить (або кодує) різні амінокислотні залишки в зазначених положеннях, і відбору варіантів з необхідними властивостями, або шляхом раціонального проектування окремих мутантів. Крім попередження гомодимеризації також існує імовірність того, що деякі з таких мутацій можуть підвищувати ефективність розщеплення вище того рівня, який одержують у випадку двох напівдоменів розщеплення дикого типу. У додаткових варіантах напівдомен розщеплення FokІ може містити одну або декілька мутацій у будь-якому амінокислотному залишку, які впливають на димеризацію. Такі мутації можуть бути застосовні для запобігання гомодимеризації одного з пари злиттів ZFP/FokІ, яка може приводити до розщеплення небажаних послідовностей. Наприклад, амінокислотні залишки в положеннях 446, 447, 479, 483, 484, 486, 487, 490, 491, 496, 498, 499, 500, 531, 534, 537 і 538 у FokІ є досить близько розташованими до поверхні контакту при димеризації, щоб впливати на димеризацію. Відповідно, зміни амінокислотної послідовності в одному або декількох зазначених вище положеннях можна використовувати для зміни димеризаційних властивостей напівдомену розщеплення. Такі зміни можуть бути внесені, наприклад, за допомогою конструювання бібліотеки, що містить (або кодує) різні амінокислотні залишки в зазначених положеннях, і відбору варіантів з необхідними властивостями, або шляхом раціонального конструювання окремих мутантів. Крім попередження гомодимеризації також існує імовірність того, що деякі з таких мутацій можуть підвищувати ефективність розщеплення вище того рівня, який одержують у випадку двох напівдоменів розщеплення дикого типу. Таким чином, для цілеспрямованого розщеплення з використанням пари злиттів ZFP/FokІ один або обидва злитих білки можуть містити зміни однієї або декількох амінокислот, що інгібують самодимеризацію, але забезпечують можливість протікання гетеродимеризації двох злитих білків так, щоб розщеплення відбувалося в необхідному сайті-мішені. У деяких варіантах зміни присутні в обох злитих білках, і зміни здійснюють адитивний вплив; тобто гомодимеризація будь-якого злиття, яка приводить до неправильного розщеплення, мінімізується або усувається, у той час як гетеродимеризація двох злитих білків полегшується в порівнянні з гетеродимеризацією, яка відбувається у випадку напівдоменів розщеплення дикого типу. У деяких варіантах домен розщеплення містить два напівдомени розщеплення, при цьому обидва являють собою частину одного поліпептиду, що містить зв’язувальний домен, перший напівдомен розщеплення і другий напівдомен розщеплення. Напівдомени розщеплення можуть мати ту саму амінокислотну послідовність або різні амінокислотні послідовності, за умови, що вони функціонують, розщеплюючи ДНК. Напівдомени розщеплення також можуть бути в окремих молекулах. Наприклад, два злитих поліпептиди можуть бути експресовані в клітині, при цьому кожен поліпептид містить зв’язувальний домен і напівдомен розщеплення. Напівдомени розщеплення можуть мати ту 22 UA 100505 C2 5 10 15 20 25 30 35 40 45 50 55 60 саму амінокислотну послідовність або різні амінокислотні послідовності, за умови, що вони функціонують, розщеплюючи ДНК. Крім того, зв'язувальні домени зв'язуються з послідовностями-мішенями, які звичайно розташовані таким чином, що після зв'язування злитих поліпептидів два напівдомени розщеплення присутні в просторовій орієнтації один відносно одного, яка забезпечує реконструювання домену розщеплення (наприклад, за допомогою димеризації напівдоменів), при цьому напівдомени розташовуються один відносно одного з утворенням функціонального домену розщеплення, що приводить до розщеплення клітинного хроматину в області, що представляє інтерес. Звичайне розщеплення реконструйованим доменом розщеплення відбувається в сайті, розташованому між двома послідовностямимішенями. Один або обидва білки можуть бути штучно сконструйовані для зв'язування із сайтом-мішенню. Експресія двох злитих білків у клітині може відбуватися в результаті доставки двох білків у клітину; доставки одного білка й однієї нуклеїнової кислоти, що кодує один з білків, у клітину; доставки двох нуклеїнових кислот, кожна з яких кодує один з білків, у клітину; або в результаті доставки однієї нуклеїнової кислоти, що кодує обидва білки, у клітину. У додаткових варіантах злитий білок містить один поліпептидний ланцюг, що містить два напівдомени розщеплення і зв’язувальний домен типу цинкового пальця. У такому випадку в клітині експресується один злитий білок, і, не маючи наміру бути пов'язаними з якою-небудь теорією, вважають, що розщеплення ДНК є результатом утворення внутрішньомолекулярного димеру з напівдоменів розщеплення. У деяких варіантах компонента ZFN розташовані таким чином, що домен типу цинкового пальця є найближчим до амінокінця злитого білка, а напівдомен розщеплення є найближчим до карбоксильного кінця. Таке положення відображує відносну орієнтацію домену розщеплення у доменах розщеплення, що димеризуються, які зустрічаються в природі, таких як домени розщеплення з ферменту FokI, у якому ДНК-зв’язувальний домен знаходиться найближче до амінокінця, а напівдомен розщеплення знаходиться найближче до карбоксильного кінця. У зазначених варіантах димеризація напівдоменів розщеплення з утворенням функціональної нуклеази відбувається в результаті зв'язування злитих білків із сайтами на протилежних нитках ДНК, при цьому 5'-кінці сайтів зв'язування знаходяться проксимально один відносно одного. У такій орієнтації найближчий до C-кінця цинковий палець розташований проксимально відносно напівдомену розщеплення FokІ. Раніше було визначено, що неканонічні білки з цинковими пальцями зв'язують свої ДНК-мішені найбільш ефективно в тому випадку, коли цинковий палець CCHC-типу присутній як найближчий до C-кінця палець. Тому можливо, що присутність раніше описаних цинкових пальців CCHC-типу поблизу з напівдоменом розщеплення FokІ інгібувала його функцію. Якщо це так, то описані в даний час оптимізовані цинкові пальці CCHC очевидно не виявляють таку передбачувану інгібуючу активність. У додаткових варіантах компоненти злитих білків (наприклад злиттів ZFP-FokI) розташовані так, що напівдомен розщеплення є найближчим до амінокінця злитого білка, а домен цинкового пальця є найближчим до карбоксильного кінця. У таких варіантах димеризація напівдоменів розщеплення з утворенням функціональної нуклеази відбувається в результаті зв'язування злитих білків з сайтами на протилежних нитках ДНК, при цьому 3'-кінці сайтів зв'язування знаходяться проксимально один відносно одного. У наступних додаткових варіантах перший злитий білок містить напівдомен розщеплення поблизу амінокінця злитого білка і домен типу цинкового пальця поблизу карбоксильного кінця, а в другому злитому білку домен типу цинкового пальця розташований поблизу амінокінця злитого білка, а напівдомен розщеплення розташований поблизу карбоксильного кінця. У зазначених варіантах обидва злитих білки зв'язуються з однією і тією же ниткою ДНК, при цьому сайт зв'язування першого злитого білка, що містить домен цинкового пальця поблизу карбоксильного кінця, розташований з 5'-сторони від сайта зв'язування другого злитого білка, що містить домен цинкового пальця поблизу амінокінця. Дивіться також WO 2005/084190; опис якої включений у вигляді посилання. Амінокислотна послідовність між доменом типу цинкового пальця і доменом розщеплення (або напівдоменом розщеплення) позначена як «ZC-лінкер». ZC-лінкер варто відрізняти від міжпальцевих лінкерів, обговорюваних вище. Дивіться, наприклад, публікації патентів США № 20050064474A1 і 20030232410, і міжнародну публікацію патенту WO05/084190, описи яких включені у вигляді посилання, у яких докладно описане одержання ZC-лінкерів, що оптимізують розщеплення. Експресуючі вектори Нуклеїнова кислота, яка кодує один або декілька ZFP або злитих білків ZFP (наприклад ZFN), може бути клонована у векторі для трансформації прокаріотичних або еукаріотичних 23 UA 100505 C2 5 10 15 20 25 30 35 40 45 50 55 60 клітин з метою реплікації і/або експресії. Вектори можуть являти собою прокаріотичні або еукаіотичні вектори, включаючи без обмеження плазміди, човникові вектори, вектори комах, бінарні вектори (дивіться, наприклад, патент США № 4940838; Horsch et al. (1984) Science 233:496-498, і Fraley et al. (1983) Proc. Natl. Acad. Sci. USA 80: 4803) і тому подібні. Нуклеїнова кислота, що кодує ZFP, також може бути клонована в експресуючому векторі для введення в рослинну клітину. Щоб експресувати злиті білки, послідовності, що кодують ZFP або злиття ZFP, звичайно субклонують у експресуючому векторі, який містить промотор для керування транскрипцією. Придатні бактеріальні і еукаіотичні промотори добре відомі в даній галузі й описані, наприклад, nd rd у Sambrook et al., Molecular Cloning, A Laboratory Manual (2 ed. 1989; 3 ed., 2001); Kriegler, Gene Transfer and Expression: A Laboratory Manual (1990); і Current Protocols in Molecular Biology (Ausubel et al., вище. Бактеріальні системи експресії ZFP доступні, наприклад, у E. coli, Bacillus sp., і Salmonella (Palva et al., Gene 22: 229-235 (1983)). Набори для таких систем експресії є комерційно доступними. Еукаіотичні системи експресії для клітин ссавців, дріжджів і клітин комах добре відомі фахівцям у даній галузі і також комерційно доступні. Промотор, використовуваний для керування експресією нуклеїнової кислоти, яка кодує ZFP, залежить від конкретного застосування. Наприклад, сильний конститутивний промотор, придатний для клітини-хазяїна, звичайно використовують для експресії й очищення ZFP. Навпаки, у тому випадку, коли ZFP вводять in vivo для регуляції генів рослин (дивіться розділ «Доставка нуклеїнових кислоти в рослинні клітини» нижче), використовують або конститутивний, або індукований промотор, залежно від конкретного застосування ZFP. Необмежувальні приклади рослинних промоторів включають промоторні послідовності, одержані з гена убіквітину-3 (ubi-3) A. thaliana (Callis, et al., 1990, J. Biol. Chem. 265, 1248612493); гена манопінсинтази (Δmas) A. tumifaciens (Petolino et al., патент США № 6730824); і/або вірусу мозаїки жилок маніоку (CsVMV) (Verdaguer et al., 1996, Plant Molecular Biology 31: 11291139). Також дивіться розділ «Приклади». Крім промотору експресуючий вектор звичайно містить транскрипційну одиницю або касету експресії, яка містить усі додаткові елементи, необхідні для експресії нуклеїнової кислоти в клітинах-хазяях, або прокаріотичних, або еукаріотичних. Таким чином, типова касета експресії містить промотор, оперативно зв'язаний, наприклад, з послідовністю нуклеїнової кислоти, яка кодує ZFP, і сигнали, необхідні, наприклад, для ефективного поліаденілювання транскрипта, термінації транскрипції, сайти зв'язування рибосом або сигнали термінації трансляції. Додаткові елементи касети можуть являти собою, наприклад, енхансери і гетерологічні сигнали сплайсингу. Конкретний експресуючий вектор, використовуваний для транспорту генетичної інформації в клітину, вибирають відповідно до передбачуваного застосування ZFP, наприклад, експресіяв рослинах, тваринах, бактеріях, грибах, найпростіших і т. д. (дивіться експресуючі вектори, описані нижче). Стандартні експресуючі вектори бактерій і тварин відомі в даній галузі і докладно описані, наприклад, у публікації патенту США № 20050064474A1 і міжнародних патентних публікаціях WO 05/084190, WO 05/014791 і WO 03/080809; описи яких включені у вигляді посилання. Можна використовувати стандартні способи трансфекції для одержання ліній клітин бактерій, ссавців, дріжджів або комах, які експресують великі кількості білка, який потім можна очистити, використовуючи стандартні методики (дивіться, наприклад, Colley et al., J. Biol. Chem. 264: 17619-17622 (1989); Guide to Protein Purification, in Methods in Enzymology, vol. 182 (Deutscher, ed., 1990)). Трансформацію еукаріотичних і прокаріотичних клітин здійснюють відповідно до стандартних способів (дивіться, наприклад, Morrison, J. Bact. 132: 349-351 (1977); Clark-Curtiss and Curtiss, Methods in Enzymology 101: 347-362 (Wu et al., eds., 1983). Можна використовувати будь-який з добре відомих способів введення чужорідних нуклеотидних послідовностей у такі клітини-хазяїни. Способи включають трансфекцію з застосуванням фосфату кальцію, полібрену, злиття протопластів, електропорації, способів обробки ультразвуком (наприклад, сонопорацію), ліпосом, мікроін'єкцій, голої ДНК, плазмідних векторів, вірусних векторів, як епісомних, так і інтегрованих, і будь-які інші добре відомі способи введення клонованої геномної ДНК, кДНК, синтетичної ДНК або іншого чужорідного генетичного матеріалу в клітину-хазяїна (дивіться, наприклад, Sambrook et al., вище). Необхідно тільки, щоб конкретний використовуваний спосіб генетичної інженерії дозволяв успішно вводити щонайменше один ген у клітину-хазяїна, здатну експресувати вибраний білок. Доставка нуклеїнових кислот у рослинні клітини Як зазначено вище, конструкції ДНК можуть бути введені (наприклад, у геном) у необхідного рослинного хазяїна множиною звичайних способів. Огляд таких способів дивіться, наприклад, у 24 UA 100505 C2 5 10 15 20 25 30 35 40 45 50 55 60 Weissbach and Weissbach, Methods for Plant Molecular Biology (1988, Academic Press, N.Y.) Section VIII, pp. 421-463; і Grierson and Corey, Plant Molecular Biology (1988, 2d Ed.), Blackie, London, Ch. 7-9. Наприклад, конструкція ДНК може бути введена в рослинну клітину з використанням таких способів, як електропорація і мікроін'єкція в протопласти рослинних клітин, або конструкції ДНК можуть бути введені безпосередньо в рослинну тканину з використанням балістичних способів, таких як бомбардування частинками ДНК (дивіться, наприклад, Klein et al. (1987) Nature 327: 7073). Альтернативно конструкції ДНК можна об’єднувати з придатними фланкуючими областями T-ДНК і вводити в звичайний вектор хазяїна Agrobacterium tumefaciens. Способи опосередкованої Agrobacterium tumefaciens трансформації, включаючи знешкодження і застосування бінарних векторів, добре описані в науковій літературі. Дивіться, наприклад Horsch et al. (1984) Science 233: 496-498, і Fraley et al. (1983) Proc. Natl. Acad. Sci. USA 80: 4803. Крім того, перенесення генів можна здійснювати з використанням бактерій, які не належать до Agrobacterium, або вірусів, таких як Rhizobium sp. NGR234, Sinorhizoboium meliloti, Mesorhizobium loti, вірус картоплі X, вірус мозаїки цвітної капусти і вірус мозаїки жилок маніоку і/або вірус тютюнової мозаїки. Дивіться, наприклад, Chung et al. (2006) Trends Plant Sci. 11(1): 14. Функції вірулентності хазяїна Agrobacterium tumefaciens будуть направляти інсерцію конструкції і сусіднього маркера в ДНК рослинної клітини в тому випадку, коли клітину інфікують бактеріями з використанням бінарного T-ДНК-вектора (Bevan (1984) Nuc. Acid Res. 12: 87118721) або при спільному культивуванні (Horsch et al. (1985) Science 227: 1229-1231). Звичайно систему Agrobacterium transformation застосовують для конструювання дводольних рослин (Bevan et al. (1982) Ann. Rev. Genet. 16: 357-384; Rogers et al. (1986) Methods Enzymol. 118: 627641). Систему Agrobacterium transformation також можна використовувати для трансформації, а також для перенесення ДНК в однодольні рослини і рослинні клітини. Дивіться патент США № 5591616, Hernalsteen et al. (1984) EMBO J., 3: 3039-3041; Hooykass-Van Slogteren et al. (1984) Nature 311: 763-764; Grimsley et al. (1987) Nature 325: 1677-179; Boulton et al. (1989) Plant Mol. Biol. 12: 31-40 і Gould et al. (1991) Plant Physiol. 95: 426-434. Альтернативні способи перенесення генів і трансформації включають без обмеження трансформацію протопластів з використанням опосередкованого кальцієм, поліетиленгліколем (ПЕГ) або електропорацією захоплення «голої» ДНК (дивіться Paszkowski et al. (1984) EMBO J., 3: 2717-2722, Potrykus et al. (1985) Molec. Gen. Genet. 199: 169-177; Fromm et al. (1985) Proc. Nat. Acad. Sci. USA 82: 5824-5828; і Shimamoto (1989) Nature 338: 274-276) і електропорації рослинних тканин (D'Hаlluіn et al. (1992) Plant Cell 4: 1495-1505). Додаткові способи трансформації рослинних клітин включають мікроін'єкцію, опосередковане карбідом кремнію захоплення ДНК (Kaeppler et al. (1990) Plant Cell Reporter 9: 415-418), і бомбардування мікрочастинками (дивіться Klein et al. (1988) Proc. Nat. Acad. Sci. USA 85: 4305-4309; і GordonKamm et al. (1990) Plant Cell 2: 603-618). Розкриті способи і композиції можна застосовувати для вбудовування екзогенних послідовностей у попередньо визначуване положення в геномі рослинної клітини. Таке вбудовування є корисним, оскільки експресія введеного в рослинний геном трансгена суттєвою мірою залежить від місця його інтеграції. Відповідно, гени, які кодують, наприклад, живильні речовини, антибіотики або терапевтичні молекули, можуть бути вбудовані за допомогою цілеспрямованої рекомбінації в області геному рослини, сприятливі для їх експресії. Трансформовані рослинні клітини, які одержують будь-яким з описаних вище способів трансформації, можна культивувати, щоб регенерувати цілу рослину, яка має трансформований генотип і, отже, необхідний фенотип. Такі способи регенерації основані на обробці деякими фітогормонами, що вводяться в середовище росту культури тканини, і звичайно основані на використанні біоцидного і/або гербіцидного маркера, який вводять разом з необхідними нуклеотидними послідовностями. Регенерація рослин з культивованих протопластів описана в Evans, et al., «Protoplasts Isolation and Culture» in Handbook of Plant Cell Culture, pp. 124-176, Macmillian Publishing Company, New York, 1983; і Binding, Regeneration of Plants, Plant Protoplasts, pp. 21-73, CRC Press, Boca Raton, 1985. Регенерацію також можна одержати з калусу рослини, експлантатів, органів, пилку, зародків і їх частин. Такі способи регенерації, загалом, описані в Klee et al. (1987) Ann. Rev. of Plant Phys. 38: 467-486. Нуклеїнові кислоти, введені в рослинну клітину, можуть бути використані для надання необхідних ознак по суті будь-якій рослині. Можуть бути сконструйовані різноманітні рослини і системи рослинних клітин для одержання необхідних фізіологічних і агрономічних властивостей, описаних у даній публікації, з використанням конструкцій нуклеїнових кислот згідно з даним винаходу і різноманітних способів трансформації, зазначених вище. У деяких варіантах 25 UA 100505 C2 5 10 15 20 25 30 35 40 45 50 55 60 рослини-мішені і рослинні клітини для конструювання включають без обмеження однодольні і дводольні рослини, такі як сільськогосподарські рослини, включаючи злакові культури (наприклад, пшеницю, маїс, рис, просо, ячмінь), плодові культури (наприклад, томат, яблуню, грушу, суницю, апельсин), фуражні культури (наприклад, люцерну), коренеплоди (наприклад, моркву, картоплю, цукровий буряк, батат), листові овочеві культури (наприклад, латук, шпинат); квітучі рослини (наприклад, петунію, троянду, хризантему), хвойні і соснові дерева (наприклад, сосну, ялицю, ялину); рослини, використовувані у фітореабілітації (наприклад, рослини, що акумулюють важкі метали); олійні культури (наприклад, соняшник, рапс) і рослини, використовувані з метою проведення наукових експериментів (наприклад, Arabidopsis). Таким чином, розкриті способи і композиції застосовні для широкого кола рослин, включаючи без обмеження види родів Asparagus, Avena, Brassica, Citrus, Citrullus, Capsicum, Cucurbita, Daucus, Glycine, Gossypium, Hordeum, Lactuca, Lycopersicon, Malus, Manihot, Nicotiana, Oryza, Persea, Pisum, Pyrus, Prunus, Raphanus, Secale, Solanum, Sorghum, Triticum, Vitis, Vigna і Zea. Фахівцю даної галузі буде зрозуміло, що після того, як касета експресії стабільно включається в трансгенні рослини, і після підтвердження того, що вона функціональна, її можна ввести в інші рослини шляхом статевого схрещування. Можна використовувати будь-яку з цілого ряду стандартних методик схрещування, залежно від виду, який піддають схрещуванню. Трансформовану рослинну клітину, калус, тканину або рослину можна ідентифікувати і виділити шляхом селекції і скринінгу матеріалу сконструйованих рослин відносно ознак, кодованих маркерними генами, присутніми у трансформуючій ДНК. Наприклад, може бути здійснена селекція за допомогою вирощування сконструйованого рослинного матеріалу на середовищах, що містять інгібуючу кількість антибіотика або гербіциду, до якого трансформуюча генна конструкція надає стійкість. Крім того, трансформовані рослини і рослинні клітини також можуть бути ідентифіковані в результаті скринінгу відносно активностей яких-небудь видимих маркерних генів (наприклад, генів β-глюкуронідази, люциферази, B або C1), які можуть бути присутніми у рекомбінантних конструкціях нуклеїнових кислот. Такі методики селекції і скринінгу добре відомі фахівцям у даній галузі. Фізичні і біохімічні способи також можна використовувати для ідентифікації трансформантів рослин або рослинних клітин, що містять вбудовані генні конструкції. Такі способи включають без обмеження: 1) Саузерн-аналіз або ПЛР-ампліфікації для виявлення і визначення структури рекомбінантної вставки ДНК; 2) Нозерн-блот, захист від РНКази S1, подовження праймера або ПЛР-ампліфікація зі зворотною транскриптазою для виявлення і дослідження РНК-транскриптів генних конструкцій; 3) ферментні аналізи для виявлення активності ферментів або рибозимів у тому випадку, коли генна конструкція кодує такі генні продукти; 4) гель-електрофорез білків, методика Вестерн-блотингу, імунопреципітація або твердофазний імуноферментний аналіз у тому випадку, коли продукти генної конструкції являють собою білки. Також можна використовувати додаткові способи, такі як гібридизація in situ, ферментне фарбування і імунофарбування, щоб виявити наявність або експресію рекомбінантної конструкції в конкретних органах і тканинах рослини. Способи проведення всіх зазначених аналізів добре відомі фахівцям у даній галузі. Ефекти маніпуляцій з генами з використанням способів, описаних у даній публікації, можна спостерігати, наприклад, за допомогою Нозерн-блотів РНК (наприклад, мРНК), виділеної з тканин, що представляють інтерес. Звичайно, якщо кількість мРНК зросла, то можна припустити, що відповідний ендогенний ген експресується в більш високому ступені, ніж раніше. Можна застосовувати інші способи вимірювання активності гена і/або CYP74B. Можна використовувати різні типи ферментних аналізів, залежно від використовуваного субстрату і способу виявлення збільшення або зниження кількості продукту реакції або побічного продукту. Крім того, рівні експресованого білка CYP74B можна виміряти імунохімічно, тобто у ELISA, RIA, EIA і інших основаних на антитілах аналізах, добре відомих фахівцям у даній галузі, таких як аналізи, основані на електрофоретичному виявленні (з використанням або фарбування, або Вестерн-блотингу). Трансген може вибірно експресуватися в деяких тканинах рослини або на деяких стадіях розвитку, або трансген може експресуватися по суті у всіх тканинах рослини і по суті протягом усього життєвого циклу. Однак також застосовний будь-який спосіб комбінаторної експресії. Даний опис також охоплює насіння трансгенних рослин, описаних вище, у тому випадку, коли насіння має трансген або генну конструкцію. Даний опис, крім того, охоплює потомство, клони, клітинні лінії або клітини трансгенних рослин, описаних вище, при цьому зазначене потомство, клон, клітинна лінія або клітина має трансген або генну конструкцію. ZFP і експресуючі вектори, що кодують ZFP, можна вводити безпосередньо в рослину для цілеспрямованого розщеплення і/або рекомбінації. 26 UA 100505 C2 5 10 15 20 25 30 35 40 45 50 55 60 Введення ефективних кількостей здійснюють будь-яким шляхом, звичайно використовуваним для досягнення тісного контакту ZFP з рослинною клітиною, що піддається обробці. ZFP вводять будь-яким придатним способом. Придатні способи введення таких композицій доступні і добре відомі фахівцям у даній галузі, і, хоча можна використовувати кілька шляхів для введення конкретної композиції, один конкретний шлях часто може забезпечувати більш швидку і більш ефективну реакцію, ніж інший шлях. Також можна використовувати носії, і вони визначаються частково конкретною композицією, що вводиться, а також конкретним способом, застосовуваним для введення композиції. Відповідно, існує широка множина придатних препаратів фармацевтичних композицій, що th можуть бути застосовні (дивіться, наприклад, Remington's Pharmaceutical Sciences, 17 ed. (1985)). Застосування Білки з цинковими пальцями, які містять один або декілька неканонічних цинкових пальців, що описані в даній публікації, застосовні для регуляції і редагування усього геному, тобто для застосувань, у випадку яких у даний час використовують канонічні ZFP C2H2, включаючи без обмеження: активацію генів; репресію генів; редагування геному (розщеплення, цілеспрямована інсерція, заміна або делеція) і епігеномне редагування (за допомогою цілеспрямованого впливу на ковалентні модифікації гістонів або ДНК). ZFN, які містять неканонічні цинкові пальці, що описані в даній публікації, можуть бути використані для розщеплення ДНК в області, що представляє інтерес, у клітинному хроматині (наприклад, у необхідному або попередньо визначуваному сайті в геномі, наприклад, у гені, або мутантному, або дикого типу). Для такого цілеспрямованого розщеплення ДНК зв’язувальний домен типу цинкового пальця конструюють так, щоб він зв'язував сайт-мішень у попередньо визначуваному сайті розщеплення або поблизу його, і злитий білок, що містить сконструйований зв’язувальний домен типу цинкового пальця і домен розщеплення, експресується в клітині. Після зв'язування частини злитого білка, представленої цинковим пальцем, із сайтом-мішенню ДНК розщеплюється поблизу сайта-мішені доменом розщеплення. Точне місце розщеплення може залежати від довжини ZC-лінкера. Альтернативно дві ZFN, кожна з який містить зв’язувальний домен типу цинкового пальця і напівдомен розщеплення, експресуються в клітині і зв'язуються із сайтами-мішенями, які розташовані один відносно одного таким чином, що відбувається реконструювання функціонального домену розщеплення, і ДНК розщеплюється поблизу сайтів-мишеней. В одному варіанті розщеплення відбувається між сайтами-мішенями двох зв’язувальних доменів типу цинкового пальця. Один або обидва зв’язувальних домени типу цинкового пальця можуть бути штучно сконструйованими. Для цілеспрямованого розщеплення з використанням злитого поліпептиду, який складається зі зв’язувального домену типу цинкового пальця і домену розщеплення, сайт зв'язування може охоплювати сайт розщеплення або сусідній кінець сайта зв'язування може знаходитися на відстані 1, 2, 3, 4, 5, 6, 10, 25, 50 або більшої кількості нуклеотидів (або будь-яке ціле число між 1 і 50 нуклеотидами) від сайта розщеплення. Точне положення сайта зв'язування відносно сайта розщеплення буде залежати від конкретного домену розщеплення і довжини ZCлінкера. У випадку застосування способів, у яких використовують два злитих поліпептиди, кожний з який містить зв’язувальний домен типу цинкового пальця і напівдомен розщеплення, сайти зв'язування звичайно виступають за обидва кінці сайта розщеплення. Таким чином, ближній кінець першого сайта зв'язування може знаходитися на відстані 1, 2, 3, 4, 5, 6, 10, 25 або більше нуклеотидів (або будь-яке ціле число між 1 і 50 нуклеотидами) з однієї сторони сайта розщеплення, і ближній кінець другого сайта зв'язування може знаходитися на відстані 1, 2, 3, 4, 5, 6, 10, 25 або більш нуклеотидів (або будь-яке ціле число між 1 і 50 нуклеотидами) з іншої сторони сайта розщеплення. Способи картування сайтів розщеплення in vitro і in vivo відомі фахівцям у даній галузі. Після введення або експресії в клітині-мішені злитий білок зв'язується з послідовністюмішенню і розщеплюється в послідовності-мішені або поблизу її. Точне місце розщеплення залежить від природи домену розщеплення і/або присутності і/або природи лінкерних послідовностей між доменами зв'язування і розщеплення. У тих випадках, коли використовують дві ZFN, кожна з який містить напівдомен розщеплення, відстань між сусідніми кінцями сайтів зв'язування може складати 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 25 або більше нуклеотидів (або будь-яке ціле число між 1 і 50 нуклеотидами). Оптимальні рівні розщеплення також можуть залежати як від відстані між сайтами зв'язування двох ZFN (дивіться, наприклад, Smith et al. (2000) Nucleic Acids Res. 28: 3361-3369; Bibikova et al. (2001) Mol. Cell. Biol. 21: 289-297), так і від довжини ZCлінкера в кожній ZFN. Дивіться також публікацію патенту США № 20050064474A1 і міжнародні 27 UA 100505 C2 5 10 15 20 25 30 35 40 45 50 55 60 патентні публікації WO 05/084190, WO 05/014791 і WO 03/080809, описи яких включені у вигляді посилання. Дві ZFN, кожна з який містить напівдомен розщеплення, можуть зв'язуватися з областю, що представляє інтерес, в однаковій або протилежній полярності, і сайти їх зв'язування (тобто сайти-мішені) можуть бути розділені будь-якою кількістю нуклеотидів, наприклад, від 0 до 50 пар нуклеотидів або будь-яким цілим числом нуклеотидів у зазначеному діапазоні. У деяких варіантах сайти зв'язування для двох злитих білків, кожний з який містить зв’язувальний домен типу цинкового пальця і напівдомен розщеплення, можуть бути розташовані один від одного на відстані 5-18 пар нуклеотидів, наприклад, 5-8 пар нуклеотидів або 15-18 пар нуклеотидів або 6 пар нуклеотидів або 16 пар нуклеотидів або в межах 10 пар нуклеотидів один від одного, при цьому відстань вимірюють від кінця кожного сайта зв'язування, найближчого до іншого сайта зв'язування, і розщеплення відбувається між сайтами зв'язування. Сайт, у якому відбувається розщеплення ДНК, звичайно лежить між сайтами зв'язування двох злитих білків. Двонитковий розрив ДНК часто виникає в результаті двох однониткових розривів або «ніків», зсунутих на 1, 2, 3, 4, 5, 6 або більше нуклеотидів (наприклад, розщеплення двониткової ДНК нативної FokI виникає в результаті однониткових розривів зі зсувом на 4 нуклеотиди). Таким чином, розщеплення не обов'язково відбувається в сайтах, розташованих точно один напроти одного на кожній з ниток ДНК. Крім того, структура злитих білків і відстань між сайтами-мішенями може впливати на те, відбувається розщеплення поруч з однією парою нуклеотидів або розщеплення відбувається в декількох сайтах. Однак для багатьох застосувань,включаючи цілеспрямовану рекомбінацію і цілеспрямований мутагенез, звичайно достатнім є розщеплення в межах визначеного діапазону нуклеотидів і не потрібне розщеплення між конкретними парами нуклеотидів. Як зазначено вище, злитий білок (білки) може бути експресований у клітині після введення в клітину поліпептидів і/або полінуклеотидів. Наприклад, два полінуклеотиди, кожний з який містить послідовності, які кодують один із зазначених вище поліпептидів, можуть бути введені в клітину, і коли поліпептиди експресуються і кожний зв'язується зі своєю послідовністю-мішенню, відбувається розщеплення в мішені або поблизу неї. Альтернативно в клітину вводять один полінуклеотид, що містить послідовності, які кодують обидва злитих поліпептиди. Полінуклеотиди можуть являти собою ДНК, РНК або будь-які модифіковані форми або аналоги ДНК і/або РНК. У деяких варіантах цілеспрямоване розщеплення в геномній області під дією ZFN приводить до зміни нуклеотидної послідовності в даній області після репарації події розщеплення в результаті з’єднування негомологічних кінців (NHEJ). В інших варіантах цілеспрямоване розщеплення в області геному під дією ZFN також може бути частиною процесу, у якому геномна послідовність (наприклад, область клітинного хроматину, що представляє інтерес) заміняється гомологічною неідентичною послідовністю (тобто при цілеспрямованій рекомбінації) за допомогою незалежних від гомології механізмів (наприклад, інсерції донорної послідовності, що містить екзогенну послідовність разом з однією або декількома послідовностями, які або ідентичні, або гомологічні, але не ідентичні попередньо визначуваній геномній послідовності (тобто сайту-мішені)). Оскільки двониткові розриви в клітинній ДНК у кілька тисяч разів стимулюють механізми репарації в клітині поблизу сайта розщеплення, таке цілеспрямоване розщеплення під дією ZFN, яке описане вище, забезпечує можливість зміни або заміни (за допомогою залежної від гомології репарації) послідовностей фактично в будь-якій ділянці геному. Для цілеспрямованої заміни вибраної геномної послідовності крім ZFN, описаних у даній публікації, потрібне введення екзогенного (донорного) полінуклеотиду. Донорний полінуклеотид може бути введений у клітину до, одночасно або після експресії ZFN. Донорний полінуклеотид має достатню гомологію з геномною послідовністю для підтримання гомологічної рекомбінації (або залежної від гомології репарації) між ним і геномною послідовністю, відносно якої він має гомологію. Приблизно 25, 50 100, 200, 500, 750, 1000, 1500, 2000 або більше гомологічних нуклеотидів у послідовності (або будь-яке ціле число від 10 до 2000 нуклеотидів або більше) будуть підтримувати гомологічну рекомбінацію. Донорні полінуклеотиди можуть мати довжину в діапазоні від 10 до 5000 нуклеотидів (або будь-яке ціле число нуклеотидів у зазначеному діапазоні) або більшу довжину. Буде легко зрозуміти, що нуклеотидна послідовність донорного полінуклеотиду звичайно не ідентична геномній послідовності, яку вона замінює. Наприклад, послідовність донорного полінуклеотиду може містити одну або декілька замін, інсерцій, делецій, інверсій або перебудов у порівнянні з геномною послідовністю, за умови наявності достатньої гомології з хромосомними послідовностями. Такі зміни послідовності можуть бути будь-якого розміру і можуть займати 28

Дивитися

Додаткова інформація

Назва патенту англійською

Protein with zinc fingers

Автори англійською

Cai, Qihua, C., Miller, Jeffrey, Urnov, Fyodor, Shukla, Vipula, K., Petolino, Joseph F., Baker, Lisa, W., Garrison, Robbi, J., Blue, Ryan, C., Mitchell, Jon, C., Arnold, Nicole, L., Worden, Sarah, E.

Назва патенту російською

Белок с цинковыми пальцами

Автори російською

Цай Цихуа К., Миллер Джеффри, Урнов Федор, Шукла Випула К., Петолино Джозеф Ф., Бейкер Лиза В., Гаррисон Робби Дж., Блю Райан С., Митчелл Джон С., Арнольд Николь Л., Уорден Сара Е.

МПК / Мітки

МПК: C12N 15/62, C12N 15/09, C12N 15/82, C07K 14/415

Мітки: білок, цинковими, пальцями

Код посилання

<a href="https://ua.patents.su/150-100505-bilok-z-cinkovimi-palcyami.html" target="_blank" rel="follow" title="База патентів України">Білок з цинковими пальцями</a>

Подібні патенти