Спосіб дискретного структурно-фрагментарного аналізу та комп’ютерна система для його здійснення
Формула / Реферат
1. Спосіб виконання дискретного структурно-фрагментарного аналізу, який передбачає використання комп'ютерної системи і включає такі етапи:
звернення (210, 220, 410) до бази даних (110, 115) молекулярних структур, яка дозволяє виконувати пошук за інформацією про молекулярні структури і біологічними і/або хімічними властивостями;
ідентифікація (220) в згаданій базі даних певної підмножини молекул, що мають певну задану біологічну і/або хімічну властивість;
визначення (230, 420) фрагментів молекул згаданої підмножини;
обчислення (230, 430, 610-650) для кожного фрагмента рейтингового значення, що відображає внесок відповідного фрагмента у згадану задану біологічну і/або хімічну властивість; і
виконання (240, 250) циклічного процесу шляхом аналізування (250) визначених фрагментів і обчислених рейтингових значень, відповідно до якого спочатку вибирають щонайменше один фрагмент, якому відповідає рейтингове значення, що відображає високий внесок в згадану біологічну і/або хімічну властивість, і потім повторюють етапи звернення, ідентифікації, визначення і обчислення.
2. Спосіб за п. 1, який відрізняється тим, що етап обчислення рейтингового значення включає операцію підрахунку (610) кількості тих молекул (х) зі згаданої підмножини, що містять певний заданий фрагмент.
3. Спосіб за п. 1 або 2, який відрізняється тим, що додатково включає етап ідентифікації в згаданій базі даних певної другої підмножини молекул, що не мають згаданої біологічної і/або хімічної властивості, причому згаданий етап обчислення рейтингового значення включає операцію підрахунку (620) кількості тих молекул (у) зі згаданих підмножини молекул і другої підмножини молекул, що містять певний заданий фрагмент.
4. Спосіб за будь-яким із пп. 1-3, який відрізняється тим, що згаданий етап обчислення рейтингового значення включає операцію підрахунку (630) кількості молекул (z) у згаданій підмножині молекул.
5. Спосіб за будь-яким із пп. 1-4, який додатково включає етап ідентифікації в згаданій базі даних певної другої підмножини молекул, що не мають згаданої біологічної і/або хімічної властивості, причому згаданий етап обчислення рейтингового значення включає операцію підрахунку (640) загальної кількості молекул (N) у згаданих підмножині молекул і другій підмножині молекул.
6. Спосіб за будь-яким із пп. 1-5, який відрізняється тим, що згаданий циклічний процес виконується шляхом вибору для наступного циклу фрагментів із більшою молекулярною масою, якщо порівнювати з фрагментами попереднього циклу.
7. Спосіб за будь-яким із пп. 1-6, який відрізняється тим, що додатково включає такі етапи:
вибір (710) певного фрагмента, що здійснюється на основі обчислених рейтингових значень;
аналіз (810) структури вибраного фрагмента;
знаходження (820) узагальненого елемента в структурі цього фрагмента; і
заміна (830) цього узагальненого елемента певним узагальненим виразом, з утворенням родової підструктури.
8. Спосіб за п. 7, який відрізняється тим, що додатково включає етап виконання (840) віртуального скринінгу з використанням цієї родової підструктури.
9. Спосіб за будь-яким із пп. 1-8, який відрізняється тим, що етап аналізування визначених фрагментів і обчислених рейтингових значень включає такі операції:
вибір (1010) певного першого фрагмента, що здійснюється на основі обчислених рейтингових значень;
вибір (1020) певного другого фрагмента, що здійснюється на основі обчислених рейтингових значень; і
утворення (1030) молекулярної підструктури, що включає згаданий перший фрагмент і згаданий другий фрагмент, шляхом застосування функції відпалу.
10. Спосіб за будь-яким із пп. 1-9, який відрізняється тим, що етап аналізування визначених фрагментів і обчислених рейтингових значень включає такі операції:
вибір (710) щонайменше одного фрагмента, що здійснюється на основі обчисленого рейтингового значення;
вилучення (720) з попередньої підмножини молекул сполук, що містять вибраний фрагмент;
вибір (730) з попередньої підмножини молекул сполук, що не містять вибраного фрагмента, або сполук, не включених в попередню підмножину молекул; і
формування (740) нової підмножини молекул, що включає згадані вилучені та вибрані сполуки.
11. Спосіб за будь-яким із пп. 1-10, який відрізняється тим, що додатково включає етап утворення (230) бібліотеки (120) фрагментів, що містить визначені фрагменти і обчислені рейтингові значення.
12. Спосіб за будь-яким із пп. 1-11, який відрізняється тим, що згадана база даних не є відкритою для загального користування.
13. Спосіб за будь-яким із пп. 1-12, який відрізняється тим, що згадана база даних є базою даних загального користування.
14. Спосіб за будь-яким із пп. 1-13, який відрізняється тим, що згадана база даних є базою даних послідовностей амінокислот і/або нуклеїнових кислот, а згаданою біологічною і/або хімічною властивістю є певний заданий вплив, що стосується відповідного білка.
15. Спосіб за будь-яким із пп. 1-14, який відрізняється тим, що згаданою біологічною і/або хімічною властивістю є певна фармакологічна властивість, і даний спосіб використовується для виявлення нових лікарських засобів.
16. Спосіб за будь-яким із пп. 1-15, який відрізняється тим, що додатково включає етап утворення (260) множини сполук, що містять щонайменше один із визначених фрагментів.
17. Спосіб за п. 16, який відрізняється тим, що додатково включає етап перевірки сполук згаданої утвореної множини на наявність згаданої заданої біологічної і/або хімічної властивості.
18. Комп'ютерна система для здійснення дискретного структурно-фрагментарного аналізу, яка включає в себе:
засоби (100, 110, 115) для звернення до бази даних молекулярних структур, яка дозволяє виконувати пошук за інформацією про молекулярні структури і біологічними і/або хімічними властивостями;
засоби (100, 130) для ідентифікації в згаданій базі даних певної підмножини молекул, що мають певну задану біологічну і/або хімічну властивість;
засоби (100, 130, 135) для визначення фрагментів молекул згаданої підмножини;
засоби (100, 130, 140) для обчислення для кожного фрагмента рейтингового значення, що відображає внесок відповідного фрагмента у згадану задану біологічну і/або хімічну властивість; і
засоби (100, 130) для визначення того, чи необхідно виконувати ще один цикл процесу, і, якщо необхідно, аналізування визначених фрагментів і обчислених рейтингових значень і виконання циклічного процесу.
Текст
Цей винахід стосується комп'ютерної системи, здатної виконувати дискретний структурно-фрагментарний аналіз, і способу її використання. Цей аналіз дозволяє виконувати за допомогою комп'ютера ідентифікацію молекул, що мають певні задані властивості, такі як біологічна і/або хімічна активність. Цей комп'ютерний дискретний структурно-фрагментарний аналіз може використовуватися для створення нових ліків або в інших галузях, де може представляти інтерес ідентифікація речовин, активних у біологічному, фармакологічному, токсикологічному, пестицидному, гербіцидному, каталітичному відношенні тощо. Від ідентифікації біологічно активних молекул залежить, наприклад, прогрес в галузі медичної хімії. У багатьох випадках науково-дослідні програми націлені на синтез невеликих органічних молекул, здатних взаємодіяти з відомим ферментом або рецептором-мішенню з метою досягнення бажаного фармакологічного ефекту. Такі сполуки можуть, принаймні частково, імітувати або інгібувати активність відомої речовини, що зустрічається в природі, але призначаються для виявлення більш сильної і/або більш селективної дії. Сполуки, що з'являються внаслідок досліджень такого роду, можуть мати певні структурні ознаки відповідних речовин, що зустрічаються в природі. Науково-дослідні програми можуть також базуватися на сполуках, що зустрічаються в природі, виявлених внаслідок скринінгу природних речовин, наприклад, проб грунту або рослинних витяжок. Виявлені таким чином активні сполуки можуть виявитися корисними базовими сполуками при використанні технологій синтетичної хімії. У останні роки зросла необхідність ідентифікації нових і корисних біологічно активних речовин, і, як наслідок, були розроблені нові способи створення базових сполук. У цьому відношенні особливо важливі два напрями, а саме комбінаторна хімія і високопродуктивний скринінг (high throughput screening - HTS). У комбінаторній хімії використовуються роботизовані або ручні методи здійснення численних дрібномасштабних хімічних реакцій, в кожній з яких використовується різна комбінація реагентів, одночасно або "паралельно", внаслідок чого створюється велика кількість різних хімічних об'єктів для скринінгу. Сукупність отриманих таким способом сполук відома як "бібліотека". Бібліотеки для створення нових хімічних базових структур звичайно максимально різноманітні. Однак за певних обставин, за допомогою підбору реактивів, призначених для введення специфічних структурних ознак в кінцеві сполуки, при формуванні бібліотек можуть робити умисний ухил в певний бік, орієнтуватися на конкретну фармакологічну мету або зосереджуватися на конкретній галузі хімії. Високопродуктивний скринінг передбачає використання біохімічних проб для швидкої перевірки активності in vitro великої кількості хімічних сполук на одній або кількох біологічних мішенях. Цей метод є ідеальним для скринінгу великих бібліотек сполук, створених комбінаторною хімією. Незважаючи на безперечні переваги комбінаторної хімії і високопродуктивного скринінгу в створенні нових базових структур, у цих методів є певні недоліки. Значна частка сполук в несистематичних бібліотеках не має корисної активності. Тому виявлення корисних базових сполук залежить від випадку і/або кількості перевірених сполук. У цілеспрямованих" бібліотеках частка активних сполук може бути більш високою, але такі бібліотеки залежать від критеріїв вибору і можуть навіть не включати оптимальних сполук. Більш того, для обох методів необхідні значні ресурси і експериментальна база. Імовірність виявлення активної молекули в певній заданій множині сполук можна підвищити або шляхом збільшення загальної кількості сполук, що перевіряються (тобто розміру цих множин), або шляхом збільшення частки активних сполук в даній множині. Можна показати, що для підвищення імовірності виявлення активної молекули збільшення частки активних сполук в певній множині сполук є ефективнішим, ніж просте збільшення загальної кількості сполук, що перевіряються. Перший підхід зменшує кількість сполук, які необхідно одержати і перевірити, і тому він також більш вигідний в сенсі витрати ресурсів, необхідних, наприклад, для виявлення біологічно активних молекул. Структурно-фрагментарний аналіз (відомий як substuctural analysis) як підхід до проблеми розробки лікарських засобів розкритий [в публікації Richard D. Cramer III. et al., J. Med. Chem., 17 (1974), cc.553-535]. У ній описано, що біологічну активність молекули, як і будь-яку іншу її властивість, треба пояснювати поєднанням внесків її структурних компонентів (підструктур) і їхніми внутрішньомолекулярними і міжмолекулярними взаємодіями. Внесок певної заданої підструктури в імовірність активності може бути отриманий з даних вже перевірених сполук, що мають цю підструктур у. Перший етап полягає в приготуванні "таблиці досвіду" підструктур, що узагальнює наявні дані. "Частота активності підструктури" (SAF) визначається для кожної підструктури як відношення кількості активних сполук , що містять цю підструктур у, до кількості перевірених сполук, що містять цю підструктуру. Вважається, що SAP відображає внесок, який дана під структура може внести в імовірність активності відповідної сполуки. Потім для кожної сполуки обчислюється середнє арифметичне значень SAF підструктур, наявних в даній сполуці. Хоч ця відома методика дозволяє ранжувати сполуки за їхніми середніми значеннями SAF, отримання такого значення вимагає обчислення середнього арифметичного значень SAF кожної підструктури сполуки. Більш того, самі значення SAF, необхідні для цих розрахунків, є результатом попереднього обчислення, яке передбачає оцінку кожної підструктур в кожній із молекул, що перевіряються. Тому цей підхід веде до значних обчислювальних витрат, що стримує застосування цієї методики до наявних на сьогодні великих наборів даних, які можна було б використати як джерело інформації для проведення структурного аналізу молекул. До цього ж, цей запропонований Крамером метод фактично не дозволяє оцінити дійсний внесок, який вносить підструктура в активність. Відповідно, в галузі хімічного структурного аналізу існує ряд інших відомих методів. У [документі ЕР 938055] розкрито спосіб визначення кількісних залежностей структура-активність" на основі отриманих високопродуктивним скринінгом даних, шляхом виявлення структурних ознак, які роблять" сполуки "активними". Цей спосіб передбачає створення статистичної моделі біологічно активних сполук, яка спочатку прив'язує різні хімічні дескриптори до певної заданої множини сполук, а потім, використовуючи певну підмножину сполук із відомою біологічною активністю, навчає цю модель прогнозувати, чи буде нова сполука біологічно активною, чи ні. [Sheridan і Kearsley, J. Chem. Inf. Comput. Sci., 35 (1995), cc.310-320], описують використання генетичних алгоритмів для вибору підмножини фрагментів із метою використання в побудові комбінаторної бібліотеки. Цей спосіб передбачає формування групи молекул з підмножини фрагментів молекул і обчислення рейтингу" кожної молекули на основі заданих дескрипторів (наприклад, атомної пари або топологічного обертання), використовуючи або пробу на подібність, або методи векторів трендів. За допомогою генетичного алгоритму формують додаткові групи і оцінюють відповідні рейтинги. У результаті одержують перелік фрагментів, що зустрічаються у молекулах з максимальном рейтингом і можуть бути використані як основа для побудови комбінаторної бібліотеки. [У WO 99/26901А1] розкривається спосіб конструювання хімічних речовин, таких як молекули. Сполука складається з каркаса і ряду місць зв'язування. Здійснення способу починається з вибору елементівкандидатів для цих місць зв'язування і створення масиву прогнозування (відомого як predictive designed array, PAD). Наприклад, PAD включає певну кількість віртуальних сполук, що задовольняють певним умовам комбінування. Ці сполуки потім синтезують і випробовують на наявність біологічної активності. Потім виконується алгоритм для прогнозування загальної біологічної активності сполук, які не були синтезовані. Для цього обчислюють значення внесків у властивість елементів-кандидатів, що представляють відповідний внесок кожного з окремих елементів у зумовлення даної активності. Потім обчислюють середній внесок в біологічну активність кожної групи-замісника в певному заданому місці зв'язування. У цьому документі наводиться приклад того, як обчислюють такий внесок. [У статті Н. Gao et al, J. Chem. Inf. Comput. Sci. (39) 1999, cc.164-168] описується застосування для виявлення нових лікарських засобів методу визначення кількісних залежностей структура-активність" (відомого як quantitative structure-activity relationship, QSAR). Після вибору біологічно активних сполук оптимізують їхню біологічну активність. Оскільки метод QSAR базується на наявності гіпотетичного зв'язку між біологічною активністю і молекулярною структурою, він використовується для ідентифікації структурних ознак, що роблять сполуки активними, і прогнозування активних і неактивних аналогів. [У документі WO 00/41060] розкривається спосіб кореляції активності речовин з їхніми структурними ознаками. Термін "структурна ознака" стосується атомів і зв'язків структури, яка відповідає певному еталонному шаблону. На першому етапі визначають речовини певної множини речовин, що задовольняють даній структурній ознаці і обмеженням щодо властивостей. Потім для кожної категорії активності визначають речовини, що попадають в цю категорію. Після розподілу цієї множини речовин по декількох категоріях активності обчислюють очікувану активність для кожної підмножини, а для кожної структурної особливості будують вектори "активність-властивість-ознака", які вказують кількості речовин, що мають згадану ознаку і входять в згадану категорію активності. Цей документ стосується біологічної активності, а також стосується виявлення нових ліків. [У US 6,185,506 В1] розкривається спосіб вибору оптимально різноманітної бібліотеки невеликих молекул, виходячи з достовірних дескрипторів молекулярної структури. Використовується множина наборів даних зі спеціальної літератури з найрізноманітніших хімічних стр уктур і активностей, які відповідають цим структурам. Активність може бути біологічною і хімічною. Цей спосіб описується в контексті фармацевтичних лікарських засобів. Крім того, розкривається спосіб вибору підмножини молекул-продуктів для всіх можливих молекулпродуктів, які можна було б створити шляхом комбінаторного синтезу з молекул-реагентів і спільних центральних молекул. У розділі, що описує попередній рівень техніки, є посилання на біологічно-орієнтовані бібліотеки, побудовані на основі знань геометричного розташування структурни х фрагментів, виділених із молекулярних стр уктур, про наявність активності у яких відомо. В цьому документі сказано, що абсолютно необхідним є використовувати раціонально побудовані, але менших розмірів, бібліотеки для скринінгу, що зберігають, проте, різноманітність комбінаційно-можливих сполук. [У WO 00/49539 А1] розкривається спосіб скринінгу певної множини молекул для ідентифікації множин ознак молекул, для яких існує імовірність кореляції з певною заданою активністю. Термін "ознака" стосується хімічних підструктур. Збирають певну множину молекул відповідно до їхньої молекулярної структури, що характеризується певною множиною дескрипторів. Потім виявляють групи, що представляють високий рівень активності, і знаходять серед цих молекул в ци х гр упах підстр уктури, які зустрічаються найчастіше. Буде логічним скорелювати ці фрагменти з рівнем активності, що спостерігається. Потім визначають набір даних, що представляє ті молекули з первинного набору даних, які містять згадану підмножину ознак, що часто зустрічаються. Цей спосіб розкривається в формі комп'ютерної системи для автоматичного аналізу набору даних. [У US 5,463,564] розкривається спосіб автоматичного створення сполук за допомогою комп'ютера шляхом роботизованого синтезу і аналізу множини хімічних сполук. Спосіб виконується ітеративно і спрямований на отримання хімічних об'єктів із заданою активністю. Утворюється хімічна бібліотека з різноманітністю певного спрямування, що містить певну множину хімічних речовин. Роботизованим аналізом хімічних сполук виявляють зв'язки між структурою і активністю. Розкривається використання декількох баз даних, кожна з яких має поле, що вказує рейтинговий коефіцієнт, призначений відповідній сполуці. Цей рейтинговий коефіцієнт призначається кожній сполуці виходячи з того, наскільки близько активність даної сполуки відповідає бажаній активності. Вищезазначені способи або є прогнозуючими моделями, або все ж не дають змоги в достатній мірі поліпшити процес створення активних базових сполук і підвищити імовірність виявлення активних сполук в заданій множині сполук. Крім того, відомі методи неспроможні задовольнити потребу в збільшенні кількості і якості молекулярних "підказок" і базових сполук, необхідних розробникам. Відповідно, мета цього винаходу полягає в тому, щоб надати спосіб використання комп'ютерної системи і відповідну комп'ютерну систему, здатні підвищити імовірність виявлення нових біологічно і/або хімічно активних молекул. Ця мета досягається цим винаходом, як він охарактеризований в незалежних пунктах формули винаходу. Варіанти здійснення, яким віддається перевага, визначені в залежних пунктах формули винаходу. Однією з переваг цього винаходу є те, що надається комп'ютерна система або метод її використання, які дають змогу збільшити частку активних сполук в певній заданій множині хімічних об'єктів, щодо яких не відомо, чи мають вони бажану активність. Це досягається шляхом застосування методів, в основі яких є використання баз знань, для ідентифікації груп-"підказок" і груп-"ключів", особливо шляхом побудови систем для виявлення молекул шляхом застосуванням обчислень. Ще одна перевага цього винаходу полягає в тому, що за допомогою аналізу бази даних, що дозволяє проведення пошуку за молекулярними структурами і біологічними і/або хімічними властивостями, вдається уникнути експериментів, що дорого коштують. Тому процес виявлення молекул, запропонований згідно з цим винаходом, може бути раціоналізований, що, в свою чергу, призведе до здешевлення процесу виявлення нових лікарських засобів. Крім того, цей винахід вигідно відрізняється тим, що дозволяє прискорити процеси виявлення, так що молекули, що мають задані бажані властивості, можна ідентифікувати швидше, ніж це можна зробити при застосуванні відомих способів. Крім того, цей винахід є дуже корисним в галузі біохімії. Здійснені в минулому розшифровка послідовності ДНК, і, особливо, секвенування генома, призвели до створення великих баз даних з послідовностями амінокислот, які можна використати як відправну точку при здійсненні цього винаходу. Крім того, цей винахід дає змогу ідентифікувати відомі і/або сирітські ліганди і/або пари сирітський ліганд-рецептор шляхом прогнозування послідовності пептидів на основі результатів, отриманих за списком структур, проаналізованих на біологічно активні хімічні детермінанти. Після ідентифікації в базі даних і за експресією, послідовності пептидів можуть бути перевірені біохімічною пробою. Відповідно, цей винахід надає переваги в тому, що він дає змогу виводити біологічні структури шляхом зіставлення зі списком хімічних молекул із вже визначеною на певній мішені активністю, і тим самим надає спосіб ідентифікації (зворотного секвенування). Винахід буде описаний докладніше з посиланням на графічні фігури, на яких: Фіг.1 - блок-схема, що ілюстр ує комп'ютерну систему, запропоновану згідно з одним із варіантів здійснення цього винаходу, яким віддається перевага; Фіг.2 - блок-схема, що ілюструє основний процес виконання дискретного структурного аналізу відповідно до одного з варіантів здійснення цього винаходу, яким віддається перевага; Фіг.3 - схематичне зображення, що ілюстр ує процес повторної ітерації згідно з цим винаходом; Фіг.4 - блок-схема, що ілюструє процес формування бібліотеки фрагментів відповідно до одного з варіантів здійснення цього винаходу, яким віддається перевага; Фіг.5 - гра фік, що показує, як можна вибирати фрагменти на основі обчислених значень внесків (рейтингових значень); Фіг.6 - блок-схема, що ілюструє процес обчислення значення внеску фрагмента відповідно до одного з варіантів здійснення цього винаходу, яким віддається перевага; Фіг.7 - блок-схема, що ілюструє процес аналізу згаданої бібліотеки фрагментів при виконанні повторної ітерації; Фіг.8 - блок-схема, що ілюструє процес вибору нової сполуки шляхом використання узагальнених подструктур; Фіг.9 - блок-схема, що ілюстр ує процес отримання підструктур для використання у віртуальному скринінгу; Фіг.10 - блок-схема, що ілюструє процес аналізу згаданої бібліотеки фрагментів при виконанні повторної ітерації із застосуванням методу відпалу відповідно до одного з варіантів здійснення цього винаходу, яким віддається перевага; Фіг.11 - приклад карти відносних внесків для ілюстрації методу відпалу, застосованого в процесі з Фіг.10; Фіг.12 - графік, що ілюстр ує дію певної сполуки на рецептор-опосередковане продукування інозиттрифосфату; Фіг.13 - графік, що ілюструє дію певної сполуки на кіназо-залежне фосфорилування білків; Фіг.14 - графік, що ілюструє дію певної сполуки на фосфатазо-залежне дефосфорилування білків; Фіг.15 - графік інформації про відносні внески, що демонструє детермінанти з їхніми відповідними значеннями внеску; Фіг.16А-16Н - інші діаграми відносних внесків, що демонструють еквівалентність оцінних функцій. Цей винахід буде описаний тепер докладніше. Крім того, з посиланням на графічні фігури будуть розглянуті варіанти його здійснення, яким віддається перевага. Наводиться також ряд прикладів того, як можна застосувати цей винахід в різних галузях. Відповідно до цього винаходу для проведення дискретного структурно-фрагментарного аналізу використовується комп'ютерна система. Здійснюються звернення до бази даних молекулярних структур. Ця база даних є такою, що є уможливленим проведення пошуку за інформацією про молекулу і біологічними і/або хімічними властивостями. Інформація про молекулярну структуру - це будь-яка інформація, придатна для визначення молекулярної структури молекули. Біологічні і/або хімічні властивості включають біохімічні, фармакологічні, токсикологічні, пестицидні, гербіцидні і каталітичні властивості. Використовуючи базу даних, спосіб, запропонований згідно з цим винаходом, ідентифікує підмножину молекул, що мають певну задану біологічну і/або хімічну властивість. Після цього у цій підмножині визначають фрагменти цих молекул. Термін "фрагмент" стосується будь-якого структурного елемента молекули, включаючи прості функціональні групи, двовимірні підструктури і їхні сімейства, прості атоми або зв'язки, а також будь-якого набору структурних дескрипторів в двовимірному або тривимірному молекулярному просторі. Фахівцеві буде зрозуміло, що фрагментом в цьому значенні може бути навіть молекулярна підструктура, що не має відомого значення в традиційній хімії. Після того як молекулярні структури згаданої підмножини будуть розбиті на фрагменти, для кожного фрагмента обчислюють рейтингове значення, що вказує внесок відповідного фрагмента в дану біологічну і/або хімічну властивість. Тобто винахід дозволяє призначати рейтингові значення фрагментам на основі існуючих знань про біологічні і/або хімічні властивості молекул. У подальшому описі молекула, стр уктура або підструктура, яка має задану властивість, буде іменуватися "активною". Молекула, структура, або підструктура, що не є активною, буде іменуватися "неактивною". Таким чином, згідно з цим винаходом пропонується структурно-фрагментарний аналіз, базований на інформації про окремі (дискретні) біологічні і/або хімічні властивості. Тому основний процес винаходу буде іменуватися далі дискретним структурнофрагментарним аналізом (DSA). Оскільки відповідно до цього винаходу фрагментам поставлені у відповідність рейтингові значення, що характеризують їхній внесок в певну задану біологічну і/або хімічну властивість, фрагменти можна розглядати як хімічні детермінанти, відповідальні за певний заданий біологічний і/або хімічний результат. Ідентифікація фрагментів здійснюється за допомогою певного набору логічних правил (алгоритму), які є частиною самого способу структурно-фрагментарного аналізу (DSA). У цьому контексті саме рейтингове значення є функцією від: (а) поширеності заданої хімічної детермінанти в підмножині, що включає активні молекули, і (б) поширеності цієї ж детермінанти у всьому переліку сполук, що перевіряються. На основі цього визначення запропонований спосіб потім визначає один або декілька локальних екстремумів згаданої рейтингової функції; хімічні детермінанти, які відповідають цим екстремумам, представляють повні або часткові хімічні розв'язки для досягнення бажаного біологічного результату. Виявлення максимально можливих значень, які рейтингова функція може приймати на будь-якому заданому наборі даних, еквівалентне ідентифікації хімічних детермінант, які містяться в підмножинах найбільш сильнодіючих біологічно активних молекул і для яких імовірність їх випадкової появи в цих підмножинах є найменшою. Нижче винахід буде описано із посиланням на графічні фігури, і, зокрема, на Фіг.1. На Фіг.1 представлений один з варіантів здійснення комп'ютерної системи, яким віддається перевага, запропонований згідно з цим винаходом. Ця комп'ютерна система включає в себе центральний блок 100 обробки даних, яким може керувати інтерфейсний засіб 105 користувача. Як блоки 100 і 105 може використовуватися будь-яка комп'ютерна система, така як робоча станція або персональний комп'ютер. У варіанті, якому віддається перевага, ця комп'ютерна система є багатопроцесорною системою з багатозадачною операційною системою. Центральний блок 100 обробки даних підключений до пам'яті 130 для зберігання програм, в якій зберігається виконуваний програмний код, що включає команди для здійснення структурно-фрагментарного аналізу (DSA) відповідно до цього винаходу. Ці команди включають функції 135 фрагментації - для розбиття молекулярних стр уктур на фрагменти, рейтингові функції 140 - для обчислення рейтингових значень, функції 145 узагальнення (наприклад, для виділення ізомерів) - для виявлення у фрагментарних структурах елементів, що можуть бути узагальнені, і заміни цих елементів загальними виразами, створюючи таким чином узагальнені підструктури, функції 150 віртуального скринінгу - для виконання віртуального скринінгу, і функції 155 відпалу для виконання використовуваного згідно з цим винаходом відпалу фрагментів. Деталі окремих функцій і процесів, здійснюваних центральним блоком 100 обробки даних при виконанні цих функції, будуть описані докладніше нижче. Центральний блок 100 обробки даних підключений, крім того, до бази даних 115 активностей структур, або переліку активностей сполук, для отримання інформації про молекулярні структури і інформації про біологічні і/або хімічні властивості. Ця інформація може бути також отримана із блоку 110 введення даних, що уможливлює доступ до зовнішніх джерел даних. Використовуючи звернення до блоків 110 і/або 115, підмножина молекулярних структур може бути отримана, наприклад, із будь-якого доступного джерела, такого як корпоративна база даних або база даних спільного користування, яке дозволяє проведення пошуку за подструктурою і/або біологічними властивостями. Базами даних спільного користування є, зокрема, такі: MDDR, Pharmaprojects, Merck Index, SciFinder, Derwent. Така підмножина молекул може також бути отримана шляхом синтезу і дослідження сполук. Цими молекулами звичайно будуть повні сполуки, але є також можливим, щоб вони були фрагментами молекул. Для будь-якої заданої біологічної або хімічної властивості, ця підмножина включає як сполуки, що не мають цієї властивості, наприклад, сполуки, що не є активними (або активність яких не досягає певного заданого порога), так і сполуки, що мають цю властивість, наприклад, сполуки, що демонструють бажану активність (тобто з активністю вище певного заданого порога). Всі неактивні сполуки є релевантними і тому аналізуються. Після звернення до внутрішніх або зовнішніх даних і виконання процесу структурно-фрагментарного аналізу (DSA) з використанням функцій, що зберігаються в пам'яті 130 для зберігання програм, центральний блок 100 обробки даних збережує бібліотеку 120 фрагментів, що включає певні фрагменти молекул разом із відповідними рейтинговими значеннями. У одному варіанті здійснення цього винаходу, якому віддається перевага, бібліотека 120 фрагментів одержана в результаті виконання основного процесу відповідно до цього винаходу. Після цього ця бібліотека 120 фрагментів може використовуватися, наприклад, вченими-хіміками і біологами, або інженерами, як джерело цінної інформації, яке може використовува тися в будь-яких подальших дослідженнях. У іншому варіанті, якому віддається перевага, ця бібліотека 120 фрагментів є проміжним результатом, одержаним при виконанні основного процесу цього винаходу, і тому може зберігатися як в енергозалежній пам'яті, так і в енергонезалежній пам'яті. Відповідно до цього варіанту здійснення бібліотека 120 фрагментів може прочитуватися центральним блоком 100 обробки даних при виконанні інших функцій, що зберігаються в пам'яті 130 для зберігання програм, для створення колекції 125 сполук. Колекція 125 сполук є колекцією молекул, у яких запропонованим згідно з цим винаходом процесом була виявлена наявність або відсутність бажаної біологічної і/або хімічної властивості. Молекули колекції 125 сполук можуть бути як вже відомими, так і гіпотетичними структурами, раніше не синтезованими. У будь-якому випадку, молекули колекції 125 сполук є результатом оцінки рейтингових значень, призначених фрагментам відповідно до дискретного структурно-фрагментарного аналізу. Як видно на Фіг.1, центральний блок 100 обробки даних підключений також до пам'яті 160 даних, в якій зберігаються множини 165 сполук, множини 170 фрагментів і рейтингові значення 175. Пам'ять 160 даних передбачена для зберігання даних, тобто використовується для зберігання вхідних параметрів при виклику функцій 135-155, або для зберігання значень, що повертаються цими функціями. Як показано на Фіг.2, що ілюструє варіант здійснення основного процесу дискретного структурнофрагментарного аналізу (DSA), якому віддається перевага, спочатку оператор комп'ютерної системи, зображеної на Фіг.1, вибирає на кроці 210 певну активність. Як згадувалося вище, активність означає будь-яку біологічну і/або хімічну властивість, в тому числі біохімічні, фармакологічні, токсикологічні, пестицидні, гербіцидні, каталізаторні властивості. Крім того, при використанні цього винаходу для ідентифікації сирітських лігандів, активністю може бути певний заданий вплив на білок, який представляє інтерес (як правило зв'язування). У цьому тексті посилання на певну задану властивість, наприклад - біологічну активність, може бути, якщо інше не зумовлене контекстом, екстрапольоване на інші типи біологічної і/або хімічної властивості. Крім того, щоб уникнути сумнівів, відзначимо,що терміни "сполука", "молекула" і "молекулярна структура" можуть, в залежності від контексту, стосуватися як молекулярних підструктур, так і повних сполук. Після вибору активності на кроці 210, на кроці 125 вибирається певна множина сполук. Вибрана множина сполук є множиною молекул, які повинні бути досліджені для того, щоб дізнатися, які фрагменти вносять внесок у вибрану активність. Як буде описано докладніше нижче, множина сполук, вибрана на кроці 220, включає в себе молекули, відомі як активні, і молекули, відомі як неактивні. Після того як будуть вибрані активність і множина сполук, процес переходить до створення бібліотеки 120 фрагментів на кроці 230. Процес створення бібліотеки фрагментів може бути описаний як процес зважування ефективності молекулярних фрагментів, що містяться в певній підмножині відомих структур, щодо певного хімічного і/або біологічного результату. Цей процес можна описати як такий, що включає такі етапи: I. ідентифікація однієї або кількох підмножин молекул, що мають певні задані властивості, необхідні для досягнення хімічного і/або біологічного результату, що представляє інтерес; II. створення попередньої бібліотеки, що містить фрагменти молекул із згаданих однієї або кількох підмножин; III. застосування алгоритму оцінки внеску цих фрагментів в хімічний і/або біологічний результат, що представляє інтерес; і IV. отримання для кожного фрагмента, до якого застосовується цей алгоритм, рейтингового значення; ці рейтингові значення можуть ранжуватися за величиною - наприклад, тим фрагментам, які з більшою імовірністю зумовлюють хімічний і/або біологічний результат, що представляє інтерес, ставлять у відповідність більші рейтингові значення. Як згадувалося вище, бібліотека 120 фрагментів включає фрагменти, а також отримані рейтингові значення для цих фрагментів. Після створення бібліотеки 120 фрагментів на кроці 230 процес може виконати повторну ітерацію на кроці 240, а може і не виконувати її. Шляхом здійснення процесу стр уктурно-фрагментарного аналізу (DSA) з використанням повторних ітерацій можна досягнути дуже ефективного використання обчислювальних ресурсів. Наприклад, процес у варіанті, якому віддається перевага, починається з невеликих фрагментів. Оскільки кількість можливих фрагментів в молекулярних стр уктурах збільшується із збільшенням максимального розміру досліджуваних фрагментів приблизно експонентно, спочатку цей максимальний розмір встановлюється досить малим, так що можна обробити навіть дуже велику кількість молекулярних стр уктур. На кроках 210-230 виявляють фрагменти з високим внеском в бажану активність. Ці виявлені фрагменти можуть бути потім використані в наступній ітерації (циклі) для виявлення фрагментів більшого розміру, тобто з більшою молекулярною масою. Приклад процесу з повторними ітераціями зображено на Фіг.3. На першій ітерації було виявлено, що фрагмент С=О вносить великий внесок в бажану активність . Цей фрагмент потім використовують для пошуку фрагментів, які більші за розміром ніж фрагменти, виявлені на першій ітерації, і при цьому включають в себе цей фрагмент. У зображеному на Фіг.3 прикладі друга ітерація показує, що фрагмент N-C=O є оптимальним фрагментом цього розміру щодо бажаної активності. Процес із повторними ітераціями продовжують, збільшуючи розміри фрагментів, внаслідок чого може бути виявлена сполука, яка, ймовірно, буде мати бажану біологічну і/або хімічну властивість і буде придатною для бажаного застосування. Повернемося тепер до Фіг.2: якщо приймається рішення виконати на кроці 240 наступну ітерацію або цикл, бібліотеку 120 фрагментів, створену на кроці 230, аналізують на кроці 250, і процес повертається на крок 220. Приклади аналізу бібліотеки 120 фрагментів на кроці 250 будуть описані докладніше нижче. Як стане зрозумілим, процес з повторними ітераціями дозволяє застосовувати більш продвинуті функції, такі як функції 145 узагальнення і функції 155 відпалу, щоб ще більш удосконалити дослідження із використанням дискретного структурно-фрагментарного аналізу. Нарешті, після прийняття рішення про припинення ітерацій (крок 240), або після закінчення процесу з повторними ітераціями, на кроці 260 створюється колекція 125 сполук. Повернувшись до кроку 230 створення бібліотеки 120 фрагментів, опишемо тепер докладніше, з посиланням на Фіг.4-6, варіант здійснення операцій цього процесу створення, якому віддається перевага. Спочатку, після звернення до внутрішньої бази даних 115 і/або зовнішнього джерела даних і ідентифікації певної підмножини молекул, на кроці 410 отримують дані "активність-структура" для ідентифікованих молекул. Потім, на кроці 420 визначають фрагменти молекул в цій підмножині. Молекули можуть бути фрагментовані за допомогою ряду відомих методів. Наприклад, може бути використаний певний алгоритм для виявлення будь-якої перестановки атомів, зв'язаних один з одним. Функції 135 фрагментації можуть використовувати мінімальний розмір фрагмента і максимальний розмір фрагмента. Або, наприклад, алгоритм фрагментації міг би бути складений таким чином, щоб ігнорувати фрагменти, атоми в яких організовані лінійно. Крім того, в алгоритм можна було б ввести обмеження, які б передбачали включення або виключення певних заданих типів зв'язків. Існує багато різних способів застосування функцій фрагментації, відомих фахі вцеві. Таким чином, кожна з молекулярних структур може бути умоглядно розбита на ряд окремих підструктур або фрагментів (крок 420). Цими фрагментами можуть бути прості функціональні групи, наприклад, NO2, СООН, СНО, CONH2; точні двовимірні підструктури, наприклад, о-нітрофенол; нечітко-визначені сімейства підструктур, наприклад, R-OH; прості атоми або зв'язки, або будь-які набори структурних дескрипторів в двовимірному або тривимірному хімічному просторі. Після розбиття молекул на фрагменти на кроці 420, на кроці 430 обчислюють рейтингові значення для цих фрагментів, обчислюючи рейтингове значення для кожного фрагмента і ставлячи обчислене значення у відповідність з цим фрагментом. Після цього визначають фрагменти з найбільшими кількісними показниками (крок 440) і зберігають їх (крок 450). Приклад того, як визначають фрагменти з найбільшими рейтинговими значеннями, зображений на Фіг.5. У цьому прикладі певні рейтингові значення представлені як функція кількості сполук, що містять відповідний фрагмент. На цьому графіку кожний фрагмент представлений точкою. Використання цього графіка на кроці 440 дає більше інформації, ніж просто вибір фрагментів із найбільшими рейтинговими значеннями шляхом порівняння цих рейтингових значень, оскільки при побудові цього графіка додатково використовується інформація про кількість сполук, в які входять відповідні фрагменти. Процес виявлення максимально можливого рейтингового значення можна вважати еквівалентним побудові філогенної сітки фрагментів, відповідних певній заданій біологічній і/або хімічній активності. Тут вузли сітки утворені самими фрагментами, а імовірність того, що певний окремий фрагмент лежить в основі даної біологічної активності, представлена відстанню від відповідного вузла до початку, тобто основи самої сітки. Таким чином, чим більшим є рейтингове значення для певного заданого фрагмента, тим далі розташовується відповідний вузол від початку сітки і тим ймовірніше, що цей фрагмент являє собою хімічний розв'язок для, наприклад, фармакофора, що розпізнається заданою мішенню. Опишемо тепер докладніше з посиланням на Фіг.6 крок 430 визначення рейтингових значень для фрагментів. Застосування рейтингових функцій 140 відповідає вищезазначеному набору логічних правил, або обчислювальних операцій. Спосіб проведення структурно-фрагментарного аналізу (DSA), запропонований згідно з цим винаходом, включає в одному з варіантів здійснення, яким віддається перевага, етап включення змінних, що характеризують поширеність кожного фрагмента, в одну або кілька математичних функцій, що визначають рейтингове значення для будь-якого заданого фрагмента. Згаданий алгоритм є функцією: (a) кількості x молекул в певній підмножині, які задовольняють певному заданому порогу щодо бажаного результату і містять певний фрагмент; (b) кількості у молекул в згаданій підмножині, які містять згаданий фрагмент, незалежно від того, чи задовольняють вони згаданому пороговому значенню, чи ні; (c) кількості z молекул в згаданій підмножині, які задовольняють згаданому порогу, незалежно від того, чи містять вони згаданий фрагмент, чи ні; і (d) кількості N всіх молекул в цій підмножині. Результатом, про який йдеться в (а), може бути будь-який бажаний параметр, що відноситься до активності цих сполук, включаючи, але не виключно, біологічну, біохімічну, фармакологічну і/або токсикологічну активність. Кожна сполука або молекула в цьому наборі даних може бути потім проаналізована на наявність бажаного параметра, відносно певного заданого порога, такого як певний заданий рівень активності. Цей поріг можна встановити на будь-якому бажаному рівні. У подальшому описі "активною" сполукою буде іменуватися така, яка задовольняє бажаному порогу, а "неактивною" сполукою іменуватися така, яка не задовольняє згаданому порогу. Ці терміни не виражають якої-небудь абсолютної властивості сполук, що розглядаються. Внесок певного заданого фрагмента може бути визначений застосуванням до змінних х, у, z і N певної міри асоціації, або рейтингової функції 140. Як добре відомо фахівцям в даній галузі, існує безліч мір асоціації, які поділяються на три основні категорії: Субтрактивні міри: наприклад, Nx-yz; Пропорційні міри: наприклад, x(N-y-z-x)/(z-x)(y-x); Змішані міри: наприклад, (x/z)-(z-x)/(N-z). Як стане очевидним, можуть бути вибрані будь-які міри асоціації, і фахівці легко зможуть зробити відповідний вибір. Отже, застосований на кроці 430 алгоритм може включати (дивись Фіг.6): (і) визначення в певній підмножині кількості x сполук, які задовольнять певному заданому порогу відносно заданого хімічного або біологічного результату і містять певну задану хімічну детермінанту (крок 610); (іі) визначення у згаданій підмножині сполук кількості у сполук, які містять цю хімічну детермінанту, незалежно від того, чи задовольняють вони згаданому порогу чи ні (крок 620); (ііі) визначення у згаданій підмножині сполук кількості z сполук, які задовольняють згаданому порогу, незалежно від того, чи містять вони цю хімічну детермінанту чи ні (крок 630); (iv) визначення в цій підмножині сполук загальної кількості N сполук (крок 640); і (ν) застосування певної міри асоціації до двох або більш змінних х, у, z і N (крок 650), у варіанті, якому віддається перевага, трьох або чотирьох змінних, а у варіанті, якому віддається найбільша перевага, до всіх чотирьох змінних х, у, z і N. Міра асоціації може бути застосована безпосередньо для визначення рейтингового значення, відповідного внеску певного заданого фрагмента. Проте у варіанті, якому віддається перевага, з міри асоціації виводять рейтингову функцію для оцінки імовірності того, що подструктура впливає на результат. Це сприяє більш чіткому ранжуванню рейтингових значень, отриманих для всієї сукупності проаналізованих фрагментів. З міри асоціації рейтингова функція може бути виведена відомими в цій галузі методами. Наприклад, ці методи можуть бути вибрані зі статистичних методів, таких як метод критичного співвідношення (z); точного критерію хі-квадрат Фішера (Fisher's Exact test), критерію хі-квадрат Пірсона (Pearson); критерію хі-квадрат МантеляХенцеля (Mantel Haenzel); і методи, базовані, але не виключно, на висновках за тангенсами кута нахилу кривих, тощо. Однак крім статистичних, можуть використовуватися й інші методи. Такі методи включають, але не виключно, обчислення і порівняння точних і приблизних довірчих інтервалів, коефіцієнтів кореляції, або навіть будь-якої функції, яка включає в себе міри асоціації, що включають поєднання однієї, дво х, трьох описаних вище змінних х, у, z і N. Прикладами математичних формул, що представляють міри асоціації або рейтингові функції, які можуть бути застосовані в цьому винаході, є: (I) x/z (II) x/Ν (III) N x-yz (IV) (x/z)-(y/N) (V) (x/z)-(z-x)/(N-z) x(N - y - z + x ) (VI) (z - x)( y - x ) Nx - yz z(N - z)y(N - y) (VII) (VIII) е[( x/y)-(z-x)/(N-z)] (Nx - yz - N / 2) N) 2 (IX) z (N - z )y (N - y ) x(N - y - z + x) - 2 1/ x+1 /(y -x )+1/( z- x)+1 /(N- y -z + x) e (X) (z - x)( y - x) x1(N - y - z1 + x1)(z 2 - x 2 )( y - x2 ) (XI) x 2(N - y - z 2 + x2 )( z1 - x1)( y - x1 ) (Nx - yz )2 N ö ÷ ÷ d i=1 z(N - z )y(N - y ) ÷ è øi (XII) Фахівець упізнає в рейтинговій функції (VII) Пірсоновський коефіцієнт кореляції, що відображає ступінь розподіленої між двома дихотомічними змінними дисперсії, явно не показаної в цій формулі. Фахівцеві в цій галузі очевидно, що рейтингова функція (VIII) відноситься до оцінки коефіцієнта ризику з використанням нахилу лінії регресії, що представляє ступінь розподіленої між двома дихотомічними змінними дисперсії. Фахівець упізнає в рейтинговій функції (IX) ста тистику "хі-квадрат", перетворену для обліку різних змішуючи х чинників. Наприклад, член N/2 в чисельнику другого відношення добутку, що перераховується в логарифмічному масштабі, являє собою узгодження із запасом нормальної апроксимації з біномінальним розподілом, що вельми корисно у випадку відносно малих величин х, у, z або N. Фа хівець зрозуміє, що замість описаних в формулах (І) і (II) мір асоціації, найбільш придатна з яких, в значенні цього винаходу, містить різні поєднання однієї, двох, трьох або чотирьох змінних х, у, z або Ν, для цієї ж мети можна використати інші міри асоціації і/або рейтингові функції. Фахівець упізнає в рейтинговій функції (X) засіб оцінки значення нижньої межі 95% довірчого інтервалу міри (III) шляхом використання логарифмічного перетворення, щоб зробити розподіл коефіцієнта більш порівнянним із нормальним розподілом, і апроксимацію першого порядку ряду Тейлора для оцінки дисперсії логарифма цього ж коефіцієнта. Фахівець упізнає в рейтинговій функції (XI) спосіб порівняння випадкових коефіцієнтів, що дозволяє визначити хімічні детермінанти, які найбільш придатні бути вибраними для його мети серед інших. Фахівцю буде зрозуміло, що рейтингова функція (XII) уможливлює поєднання декількох критеріїв асоціації, дозволяючи ідентифікувати хімічні детермінанти, для яких імовірність того, що вони водночас впливають на дві або кілька заданих властивостей, є найбільшою. Фахівцю буде зрозуміло також, що рейтингову функцію можна перетворити до такого вигляду, щоб вона включала додаткові змінні, які б стосувалися речовинних, біологічних, хімічних і/або фізико-хімічних властивостей молекули. Наприклад, такі перетворення могли б включати в себе (але не виключно) поправки на дієвість, селективність, токсичність, біологічну доступність, стабільність (метаболічну або хімічну), можливість синтезу, чистоту, наявність на ринку, доступність відповідних реагентів для синтезу, вартість, молекулярну масу, молярну заломлюючу здатність, молекулярний об'єм, логарифм імовірності (logP) (обчислений або визначений), кількість приймаючих водневі зв'язки груп, кількість віддаючих водневі зв'язки груп, заряди (парціальні і формальні), константи протонування, кількість молекул, що містять додаткові хімічні цільові компоненти або дескриптори, кількість здатних обертатися зв'язків, показник гнучкості, показники форм молекул, схожості орієнтаційного упорядкування і/або об'єми перекриття. Таким чином, наприклад, рейтингову функцію (VIII) можна перетворити, наприклад, для ура хування молекулярної маси (MW) кожної хімічної детермінанти, що розглядається, таким чином: MW×e[( x/z)-(z-x)/(N-z)]. Аналогічним чином, рейтингову функцію (IX) можна перетворити до такого вигляду, щоб вона включала змінні MW і [S], що відповідно представляють молекулярну масу (MW) хімічної детермінанти, що розглядається, і кількість появ цієї хімічної детермінанти в підмножині активних сполук x ([S]), таким чином: 1 d æ åç ç ç ( ) 2 æ x Nx - yz - N / 2 N ö ÷ Logç MW × × ç [ S] z(N - z)y(N - y) ÷ ç ÷ è ø , (II) Рейтинг = для ідентифікації при здійсненні аналізу найбільших, одноточкових, біологічно активних хімічних детермінант. Результат кроку 650 алгоритму дає рейтингове значення для даного фрагмента. Кроки 610-650 алгоритму можуть бути повторені для кожного вибраного фрагмента з даних. Після обчислення рейтингових значень для всіх вибраних фрагментів одержують рейтингові значення, які відповідають потенційній ефективності кожного із проаналізованих фрагментів. Рейтинги можуть ранжуватися за їх значеннями; наприклад, фрагментам, для яких імовірність того, що вони зумовлюють заданий хімічний і/або біологічний результат, є більшою, ставляться у відповідність більші рейтингові значення. Це уможливлює здійснення на кроці 440 ідентифікації одного або кількох локальних екстремумів значень рейтингової функції, так що хімічні детермінанти, які їм відповідають, представляють повні або часткові розв'язки для досягнення бажаного хімічного або біологічного результату. Знаходження найбільших рейтингових значень, які можуть бути отримані в будь-якому заданому наборі даних, еквівалентне ідентифікації хімічних детермінант, які містяться в підмножинах молекул, що мають бажані властивості, причому таких хімічних детермінант, що імовірність їх випадкового з'явлення у цих підмножинах є мінімальною. У тому випадку, коли бажана властивість є певною заданою біологічною активністю, фрагменти або хімічні детермінанти з найбільшими рейтинговими значеннями є біологічно активним фармакофором. Повернувшись до Фіг.2, розглянемо тепер варіанти, яким віддається перевага, здійснення кроку 250 аналізу бібліотеки 120 фрагментів. Один зі способів аналізу бібліотеки 120 фрагментів зображений на Фіг.7. Процес починається з вибору фрагмента на кроці 710, виходячи з рейтингових значень, визначених при здійсненні попередньої ітерації. Потім, на кроці 720, добувають сполуки, які включають вибраний фрагмент, з поточної множини сполук. Оскільки на кроці 710 був вибраний фрагмент, вплив якого на бажану активність є великим, сполуки, що добуваються на кроці 720, можна розглядати як активні сполуки. Після цього (крок 730) вибирають певну множину неактивних сполук, або зі згаданої поточної множини сполук, або з баз даних, або з будь-якого іншого джерела. Після цього активні і неактивні сполуки об'єднують на кроці 740 для утворення нової множини сполук. Потім на кроці 220 цю нову множину сполук вибирають як множину сполук для створення бібліотеки фрагментів при здійсненні наступної ітерації і виконують наступний цикл. Тепер, із посиланням на Фіг.8, буде описаний один із варіантів здійснення кроку 730, яким віддається перевага. У цьому варіанті здійснення для вибору нової множини сполук для наступної ітерації використовуються родові підструктури. Представлений на Фіг.8 процес починається з аналізу на кроці 810 структури фрагмента, вибраного на кроці 710. При втілені варіанту винаходу з узагальненням фрагмент, що його вибирають на кроці 710, може бути вибраний шляхом оцінювання рейтингового значення, обчисленого на попередній ітерації. Крім того, вибір фрагмента може бути зроблений в залежності від додаткових чинників, що впливають на придатність цього фрагмента бути початковим точкою для узагальнення. Ця придатність могла б визначатися кількістю атомів або зв'язків, тим, як ці атоми зв'язані, тривимірною структурою відповідного фрагмента тощо. Після здійснення аналізу цього вибраного фрагмента на кроці 810, на кроці 820 в структурі цього фрагмента знаходять узагальнюваний елемент. Цей елемент потім замінюється на кроці 830 загальним виразом; як результат, одержують родову підструктуру (наприклад, щоб знайти біологічні ізостери). Прикладом є де у вибраному фрагменті були виявлені і замінені загальними виразами [Аr] і А два узагальнюваних елементи, де [Аr] представляє ароматичний центр, і А представляє С або S. Створена на кроці 830 родова підструктура використовується для здійснення віртуального скринінгу для знаходження нових сполук із такою родовою підструкгурою. Термін "віртуальний скринінг" стосується будьякого процесу скринінгу, який виконується лише з даними, завдяки чому відпадає необхідність синтезувати сполуки. Нові сполуки, виявлені за допомогою віртуального скринінгу, використовують на кроці 850 для створення нової множини сполук, які потім можуть бути використані на наступній ітерації. Як видно на Фіг.9, процес віртуального скринінгу можна розділити на внутрішні і зовнішні модифікації фрагментів, що їх модифікують з використанням родових підструктур. Вн утрішні модифікації (крок 910) включають заміщення, вставки, видалення і інверсії атомів у фрагменті. Починаючи з вищезазначеного конкретного фрагмента і узагальнюючи цей фрагмент у родову підструктур у, в наступному прикладі одержують три різні заміни: Зовнішні модифікації (крок 920) полягають у зміні замісників для фрагмента. Вони можуть бути випадковими, цілеспрямованими тощо. Цілеспрямовані множини сполук - це колекції молекул, одержані шляхом модифікації однієї або кількох родових підструктур: Хоч на Фіг.9 показано, що кроки внутрішньої і зовнішньої модифікацій виконуються послідовно, фахівцеві буде очевидно, що за рамки цього винаходу не вийде виконання тільки одного з цих видів модифікацій, або виконання обох модифікацій в іншій послідовності, або навіть паралельно. Слід відзначити, що результатом віртуального скринінгу є диверсифікована колекція сполук, що мають високий шанс виявитися активними, оскільки вони збагачені підструктурами, які асоціюються з активністю. Хоч на кроці 710 вибирають один фрагмент, який виступає як основа для застосування функцій 145 узагальнення для отримання родової підструктури, відповідно до ще одного варіанту здійснення цього винаходу, якому віддається перевага, для створення родових підструктур вибирають більшу кількість фрагментів із великими рейтинговими значеннями. Наприклад, як було виявлено, нижченаведені фрагменти характеризуються високими внесками в бажану активність, і вони можуть бути вибрані на кроці 710: Після цього ці вибрані фрагменти перетворюють у родові підструктури з високими рейтинговими значеннями, наприклад: Ці родові підструктури потім використовують для віртуального скринінгу наявних на ринку баз даних або внутрішньокорпоративних колекцій сполук. Хоча, як було зазначено, процес з повторними ітераціями є ефективнішим щодо використання обчислювальних ресурсів, оскільки доцільно починати з невеликих фрагментів і збільшувати розмір фрагментів з кожною ітерацію, і хоча, крім того, було показано, що ефективність може бути ще більше збільшена шляхом використання узагальнення при здійсненні процесу з повторними ітераціями, цей винахід передбачає ще один підхід, що дозволяє ще більш удосконалити процес дискретного структурнофрагментарного аналізу, запропонованого згідно з цим винаходом. Цей інший підхід базується на методиці віддалення і буде описаний нижче з посиланням на Фіг.10. У представленому на Фіг.10 варіанті здійснення, якому віддається перевага, крок 250 аналізу бібліотеки фрагментів, яка була створена на попередній ітерації, починається з кроків 1010 і 1020 вибору першого і другого фрагментів. Обидва фрагменти вибирають на основі обчислених рейтингових значень, і їх можна вважати фрагментами, що вносять великий внесок. На наступному кроці 1030 для сполучення цих першого і другого фрагментів застосовується функція 155 відпалу. Сполучення фрагментів означає визначення молекулярної структури або підструктури, що включає в себе обидва фрагменти. Для цієї мети можуть використовуватися декілька функцій 155 відпалу. Ці функції відпалу відрізняються реалізацією того, як оцінюються і використовуються певні параметри відпалу. Параметрами відпалу є, наприклад, відстань (заздалегідь задана) між першим і другим фрагментами, тривимірна орієнтація першого і другого фрагментів, кількість атомів, вставлених між цими фрагментами, кількість зв'язків, що використовуються для "склеювання" цих фрагментів, вид зв'язків і атомів тощо. Крім того, відпал у варіанті, якому віддається перевага, поєднується з описаним вище аспектом, що використовує узагальнення. Якщо, наприклад, на кроках 1010 і 1020 вибирають фрагменти, про які відомо, що у них високі рейтингові значення, в функції відпалу, яку вибирають на кроці 1030 і виконують на кроці 1040, для сполучення фрагментів можна б використати узагальнений вираз F1-[G]-F2 Загальний вираз [G] є синонімом молекулярних підструктур із певними заданими властивостями і параметрами відпалу і залежить від використовуваної функції відпалу. Після сполучення фрагментів, за допомогою точних або загальних виразів, на кроці 1040 створюють нову множину сполук, в яку входять обидва фрагменти. Приклад молекули з цієї нової множини сполук представлений на Фіг.11, що є двовимірною діаграмою відносних внесків, яка показує відносний внесок відносно локальних координат. Як видно на Фіг.11, є два локальних екстремуми - рейтингові значення приблизно 1,2 і 1,7 для фрагментів F1 і F2. Процес відпалу має дві переваги. Першою його перевагою є те, що шляхом сполучення двох фрагментів із високими внесками в бажану активність можна отримати більші молекули, які можуть виявитися ефективними - оскільки вони включають не один, а декілька фрагментів із великими рейтинговими значеннями. Відповідно, значною буде імовірність того, що у стр уктур, що їх одержують, рейтингове значення виявиться більшим, ніж максимальне із рейтингових значень для цих двох окремих фрагментів. Наприклад, у випадку, зображеному на Фіг.11, одержана в результаті сполука включає фрагменти, що мають рейтингові значення 1,2 і 1,7, але рейтингове значення для всієї структури може дорівнювати, наприклад, 2,1. Тому метод відпалу навіть дозволяє одержувати сполуки з ще більш високою активністю. Другою перевагою є те, що метод відпалу дозволяє уникати тупикових ситуацій в обчислювальному процесі. Як видно на Фіг.11, значення відносних внесків відображені двома локальними екстремумами. При виконанні процесу з повторними ітераціями, зображеного на Фіг.3, який починає з невеликих фрагментів і на кожній ітерації якого розміри фрагментів збільшуються, в тому випадку, якщо вибраний фрагмент на одному із проміжних кроків виявиться на локальному максимумі, може виникнути тупикова ситуація. Наприклад, коли в кінці другої ітерації вибирають фрагмент N-C=O і цей фрагмент знаходиться на локальному максимумі, наступна ітерація не буде успішною. Як описано вище, фрагменти для наступної ітерації у варіанті, якому віддається перевага, будуються з відібраного на попередній ітерації фрагмента шляхом покрокового збільшення розмірів фрагмента. Таким чином, який би атом не додавався до вибраного фрагмента, наступна ітерація змістить цей фрагмент в сторону від локального максимума. Тобто в цьому випадку у будь-якого одержаного в результаті фрагмента рейтингове значення буде нижчим, ніж у фрагмента, вибраного на попередній ітерації. Щоб уникнути такої тупикової ситуації, може бути застосована методика відпалу шляхом вибору двох фрагментів із попередньої ітерації з високими рейтинговими значеннями, сполучення цих фрагментів, обчислення нового рейтингового значення і продовження процесу. Це можна виконувати періодично, від ітерації до ітерації, або при виявленні тупикової ситуації. Хоч цей винахід був описаний із використанням ряду варіантів здійснення, яким віддається перевага, фа хівцю в цій галузі буде очевидно, що цей винахід ніяким чиномне обмежено цими варіантами. Наприклад, може бути змінена послідовність здійснення кроків, показаних на блок-схемах, або кроки, показані як такі, що виконуються послідовно, можна було б навіть виконувати паралельно: дивись, наприклад, кроки 1010 і 1020 способу, показаного на Фіг.10. Більш того, фахівцеві буде очевидно, що не всі показані етапи способу потрібні в кожному випадку. Наприклад, в показаному на Фіг.6 процесі визначення рейтингових значень параметри, що не використовуються рейтингового функцією, обчислювати немає необхідності. Крім того, ці параметри можна було б обчислювати, використовуючи багатозадачну або багатопотокову операційну систему. Нижче будуть описані як приклади інші варіанти здійснення цього винаходу. Наприклад, бібліотека фрагментів, що створюється на кроці 230, теоретично може містити всі можливі фрагменти і їх комбінації. Практично це можна досягти шляхом створення бібліотеки за допомогою комп'ютера. Однак, якщо бібліотека створюється вручну, найімовірніше вона буде містити лише певну вибірку із всіх можливих фрагментів. Відповідно, спосіб можна повторювати, використовуючи комбінації фрагментів, зокрема, комбінації фрагментів, для яких за результатами попереднього аналізу були отримані високі рейтингові значення. Таким чином, після первинного аналізу фрагментів ті фрагменти, які ймовірніше усього вносять внесок у бажаний хімічний і/або біологічний результат, можуть бути скомбіновані, і до них може бути застосований алгоритм для оцінки внеску об'єднаного фрагмента в бажаний хімічний і/або біологічний результат, як описано вище. Отримане рейтингове значення може бути порівняне з рейтинговими значеннями окремих фрагментів, щоб перевірити, чи призводить таке поєднання до збільшення внеску в бажаний хімічний і/або біологічний результат. У ще одному варіанті здійснення цього винаходу можна було б виділити із фрагментів, що вносять найбільші внески у бажаний хімічний і/або біологічний результат, спільний структурний елемент, щоб визначити, чи є внесок цього спільного елемента таким самим або більшим, ніж у початкових фрагментів. Фрагменти з найвищими рейтинговими значеннями є хімічною детермінантою або молекулярним фінгерпринтом, що мають найбільшу вагу за внеском в певний заданий хімічний або біологічний результат. Після ідентифікації цього фінгерпринта можна потім створити бібліотеку сполук, що містять цю хімічну детермінанту (або детермінанти). Сполуки можна отримати за допомогою певної програми синтезу, орієнтованої на задану структурну ознаку. Як альтернативний варіант, сполуки, що містять цю хімічну детермінанту, можна ідентифікувати за комерційними каталогами і придбати з відповідних джерел. Ці сполуки необов'язково повинні бути фармакологічної чистоти і можуть бути доступні з найрізноманітніших джерел. Після того як бажана бібліотека буде зібрана, її можна піддати скринінгу за мішенню (мішенями), що представляє (представляють) інтерес. Як результат цього скринінгу можуть бути виявлені сполуки, досить активні для подальшого дослідження, або можуть бути отримані базові сполуки для програми синтезу. Спосіб дискретного структурно-фрагментарного аналізу (DSA), запропонований згідно з цим винаходом, дозволяє створювати диверсифіковані, проте високоспеціалізовані бібліотеки, щодо конкретної біологічної або фармакологічної мети. Таким чином набагато підвищується імовірність досягнення успіху при скринінгу, що його проводять для виявлення активних сполук і/або корисних базових сполук. У ще одному варіанті здійснення пропонується спосіб ідентифікації молекул, що мають певні задані бажані властивості, таких як біологічно активні молекули, який включає: - у певній підмножині молекул, визначення ваги внесків молекулярних фрагментів у досягнення певного заданого хімічного або біологічного результата, як описано вище; - ідентифікацію одного або кількох фрагментів із максимальною вагою; - складання певної множини сполук, що містять один або кілька таких фрагментів; - необов'язково - перевірку цих сполук на наявність бажаних властивостей. Зрозуміло, що даний спосіб може рівною мірою використовуватися для ідентифікації фрагментів, що зумовлюють небажані властивості, наприклад, негативні біологічні побічні ефекти, і, відповідно, для виключення з розгляду сполук, що включають такі фрагменти. Таким чином, шляхом здійснення запропонованого згідно з цим винаходом способу створюються структурні гіпотези (фрагменти), імовірність зумовлення, якими певного заданого біологічного, біохімічного, фармакологічного або токсикологічного результату оцінюється шляхом обчислення кількісного рейтингового значення. Приймаючи до уваги рейтингове значення для певного фрагмента, розробник лікарських засобів може ухвалюва ти обґрунтовані рішення щодо підходу, який забезпечуватиме досягнення бажаної мети із найбільшою імовірністю, такої як ідентифікація сполук з сильнішою дією, відкриття нової серії активних сполук, ідентифікація сполук, що характеризуватимуться більшою селективністю або вищою біодоступністю, або позбавлення токсичної дії. Спосіб, запропонований згідно з цим винаходом, зосереджується на фрагментах, наявних в підмножині сполук, що представляють інтерес, завдяки чому усувається необхідність у виконанні ресурсномістких обчислень для обширних, але, найімовірніше, менш релевантних секторів хімічного простору. Це призводить до скорочення обсягів обчислювань, необхідних для пошуку розв'язки задачі досягнення певного заданого біологічного результату, в той же час зберігаючи базовий рівень розуміння на молекулярному рівні, необхідний для теоретичного допущення існування біологічно активних хімічних детермінант. Як говорилося вище, процес, запропонований згідно з цим винаходом, передбачає пошук локальних екстремумів однієї або кількох функцій, які можна підібрати таким чином, щоб вони відповідали ймовірностям, що наводяться в звичайних статистичних таблицях. Отже, надається гарний спосіб оцінки потенційного внеску певного заданого фрагмента в хімічний або біологічний результат. Однак для здійснення цього винаходу необов'язково базувати аналіз на статистичній теорії. Спосіб виконання дискретного структурно-фрагментарного аналізу (DSA), запропонований згідно з цим винаходом, може використовуватися в розв'язанні широкого кола прикладних задач, що постають в процесі створення нових лікарських засобів. Як було описано вище, цей спосіб дозволяє виявляти фармакофори, які із високою імовірністю обумовлюють певну задану біологічну активність, наприклад, речовин-антагоністів рецепторів 7-ТМ, інгібіторів кінази, інгібіторів фосфатази, речовин, що блокують іонні канали, інгібіторів протеази, а також активних фрагментів пептидергічних лігандів, що зустрічаються в природі. Цей спосіб також дозволяє виявляти ендогенні модулятори мішеней лікарських засобів, полегшуючи ідентифікацію нових осей фармакологічного втручання, а також ефективне надання нових фармакологічних властивостей молекулам, раніше позбавленим таких властивостей. Цей спосіб може бути також використаний для виявлення хибнопозитивних і хибнонегативних результатів в наборах даних, наприклад, отриманих як результат високопродуктивного скринінгу (HTS). Дискретний структурно-фрагментарний аналіз (DSA) може також застосовуватися для прогнозування селективності сполук, наприклад, шляхом виявлення потенційно небажаних сторонніх ефектів. Таким же чином цей спосіб може використовуватися для прогнозування токсичних властивостей сполуки шляхом ідентифікації її "токсикофорних" хімічних детермінант, що, у поєднанні з описаним вище, дозволяє будувати бази даних хімічних детермінант, які можуть бути дуже корисними при виборі хімічних рядів. У цьому контексті цей спосіб, крім того, дозволяє ефективно додавати нові фармакологічні властивості хімічним сполукам, раніше позбавленим таких властивостей. Нарешті, завдяки своїй здатності визначати рівень молекулярної різноманітності, найбільш ефективний для досліджень шляхом скринінгу, спосіб виконання дискретного структурно-фрагментарного аналізу (DSA) дозволяє здійснити ефективні, з широким застосуванням паралелізму, автоматизовані процедури високопродуктивного скринінгу, що є суттєвим поліпшенням в порівнянні з високопродуктивними (НТР) стратегіями, що використовуються в цей час. Зрозуміло, що в описаному вище способі щонайменше один етап здійснюється комп'ютерною системою. Відповідно, наприклад, значення х, у, z і Ν, отримані з бази (баз) даних, можуть бути введені у відповідним чином запрограмований комп'ютер і оброблені ним. Отже, цей винахід поширюється на подібні здійснювані під керуванням або втілені за допомогою комп'ютера способи. З наведеного вище опису зрозуміло, що цей винахід пропонує новий спосіб швидкого виявлення молекул, що мають певні задані властивості, таких як біологічно активні молекули. Зокрема, винахід стосується способу зважування молекулярних структур з метою виявлення біологічно активних компонентів молекулярних структур і використання цих компонентів при побудові спеціалізованих колекцій хімічних сполук для підвищення ефективності процесу створення нових лікарських засобів і зменшення пов'язаних з цим витрат. Пропонується спосіб збільшення частки біологічно активних сполук у певній заданій множині хімічних об'єктів, щодо яких немає відомостей про наявність у них бажаної біологічної активності. Згаданий спосіб передбачає застосування різних математичних методів для визначення кількісних залежностей структураактивність" (QSAR). Цей новий спосіб, який можна назвати дискретним структурно-фрагментарним аналізом (DSA), наприклад, надає розв’язання проблеми розпізнавання фармакологічної моделі впливу, тобто проблеми ідентифікації хімічних детермінант (CD), які відповідальні, в певній заданій сполуці, за який-небудь заданий хімічний або біологічний результат, яким може бути, наприклад, біологічна, біохімічна, фармакологічна, хімічна і/або токсикологічна активність. Спосіб, запропонований згідно з цим винаходом, має широке застосування і не обмежений фармацевтичною галуззю. Розглядаючи біологічно активні сполуки, цей спосіб можна застосовувати, наприклад, до пестицидів і гербіцидів, де бажаною біологічною активністю є відповідно пестицидна і гербіцидна активність. Цей спосіб може також використовуватися при моделюванні реакцій, де бажаними властивостями є швидше хімічні, ніж біологічні, властивості, наприклад, при створенні каталізаторів. Як буде зрозуміло, методика, передбачена цим винаходом, полягає в об'єднанні в рамках певної підмножини сполук, або різних підмножин сполук, тих фрагментів, для яких ймовірність того, що саме вони вносять внесок в хімічний і/або біологічний результат, що представляє інтерес, є найбільшою, і застосуванні певного алгоритму для оцінки внеску цього складеного фрагмента у згаданий хімічний і/або біологічний результат, що представляє інтерес, причому отримане рейтингове значення може бути порівняне з рейтинговими значеннями окремих фрагментів, щоб перевірити, чи призводить об'єднання до підвищення внеску в хімічний і/або біологічний результат, що представляє інтерес. Крім того, винахід дозволяє виділяти з цих фрагментів, що вносять найбільший внесок в хімічний і/або біологічний результат, що представляє інтерес, певної спільної структурної частини, щоб визначити, чи є внесок цієї спільної частини таким самими або вищим, ніж внески початкових фрагментів. Більш того використовується міра асоціації, яку у варіанті, якому віддається перевага, вибирають з субтрактивних мір, пропорційних мір і змішаних мір. Ця міра асоціації у варіанті, якому віддається перевага, вводиться у рейтингову функцію, або останню будують на основі міри асоціації. Рейтингова функція може бути побудована за допомогою певного статистичного методу, такого як метод критичної пропорції, точний критерій Фішера, критерій хі-квадрат Пірсона, критерій хі-квадрат Мантеля-Хенцеля, методу висновків за тангенсом кута нахилу кривих тощо. У ще одному варіанті здійснення, якому віддається перевага, ця рейтингова функція будується за допомогою методу, вибраного з обчислення і порівняння точних і наближених довірчих інтервалів, коефіцієнтів кореляції або будь-якої функції, що явно включає в себе певну міру асоціації, що включає будь-яке поєднання однієї, двох, трьох або чотирьох змінних: х, у, z і N. У варіанті, якому віддається перевага, винахід виконує операцію вибору молекул, що містять найбільш рейтингові фрагменти, як потенційних лігандів, і, необов'язково, подальшу перевірку того, чи є вони модуляторами мішеней лікарських засобів. Спосіб, запропонований згідно з цим винаходом, у варіанті, якому віддається перевага, може бути використаний для ідентифікації хибнопозитивних і/або хибнонегативних експериментальних результатів. Іншими застосуваннями, яким віддається перевага, є пошук схожості, аналіз різноманітності і/або аналіз відповідності. Нижче наводяться приклади, що демонструють численні застосування способу дискретного структурнофрагментарного аналізу (DSA), запропонованого згідно з цим винаходом. Ці приклади є варіантами здійснення цього винаходу, яким віддається перевага, і служать для його ілюстрації, але не повинні розглядатися як такі, що обмежують його обсяг. Приклад №1. Ефективна ідентифікація нових і селективно діючих лігандів рецептора З використанням препарата рекомбінантної мембрани і міченого радіоактивним ізотопом пептиду було проведено дослідження конкурентного зв'язування для рецептора клітинної поверхні. В рамках цього дослідження була приготована колекція сполук для перевірки, і в ході цієї перевірки з використанням способу, запропонованого згідно з цим винаходом, були виявлені нові ліганди рецептора. Перший етап полягав в складанні переліку з 208 структур-антагоністів цього рецептора шляхом огляду наукової літератури, наявної на сьогоднішній день. Другий етап полягав в ідентифікації біологічно активних хімічних детермінант, що містяться в цих 208 лігандах рецептора. Для цього був утворений додатковий перелік, що містив 101130 структур, які раніше описувалися в літературі як такі, що не впливають на цей рецептор, і доданий до першого переліку. Одержаний в результаті перелік з 101338 структур був проаналізований на присутність біологічно активних хімічних детермінант шляхом вибору субтрактивної міри асоціації (І), де x - кількість активних хімічних стр уктур, що містять хімічну детермінанту, що представляє інтерес, у - загальна кількість хімічних структур, що містять цю детермінанту, z - загальна кількість активних хімічних структур в множині з N молекул (тобто z=208), і N - загальна кількість хімічних стр уктур, що є предметом аналізу (тобто N=101388). (І) Nx-yz На основі міри асоціації (І) була побудована рейтингова функція (II), в якій фахівець упізнає опосередковану міру імовірності події, модифіковану для урахування різних змішуючи х чинників. Наприклад, член N/2 в чисельнику другого відношення добутку уможливлює консервативне врахування нормальної апроксимації з біномінальним розподілом, що вельми корисно у випадку відносно малих величин х, у, z і N. Змінні MW і [S], що відповідно представляють молекулярну масу (MW) хімічної детермінанти, що представляє інтерес, і кількість разів ([S]), що ця хімічна детермінанта зустрічається у цій підмножині активних сполук х, були включені в цю рейтингову функцію для того, щоб полегшити ідентифікацію в ході аналізу максимально великих одноелементних біологічно активних хімічних детермінант. Фахівець зрозуміє, що інші міри асоціації і/або рейтингові функції можуть бути використані для цієї ж мети замість описаних в формула х (І) і (II), найбільш ефективні з яких, в контексті цього винаходу, включають в різних поєднаннях дві, три або чотири змінні х, у, z і N. 2 æ x Nx - yz - N / 2 N ö ÷ Logç MW × × ç [ S] z(N - z)y(N - y) ÷ ç ÷ è ø , (II) Рейтинг = Фахівцю буде також зрозуміло, що рейтингову функцію (II) можна було б додатково модифікувати так, щоб вона містила додаткові змінні, які б характеризували речовинні, біологічні, хімічні і/або фізико-хімічні властивості молекули. Наприклад, такі модифікації могли б включати (але в жодному разі не лише це) урахування дієвості, селективності, токсичності, біологічної доступності, стабільності (метаболічної або хімічної), можливості синтези, чистоти, наявності на ринку, доступності реагентів для синтезу, вартості, молекулярної маси, молярної заломлюючої здатності, молекулярного об'єму, логарифму імовірності (logP) (обчисленого або визначеного), поширеності підструктури в колекції подібних до ліків молекул, загальної кількості і/або типів атомів, загальної кількості і/або типів хімічних зв'язків і/або орбіталей, кількості приймаючих водневий зв'язок груп, кількостей віддаючих водневий зв'язок груп, зарядів (парціальних і формальних), констант протонування, кількості молекул, що містять додаткові хімічні базові компоненти або дескриптори, кількості здатних обертатися зв'язків, показників гнучкості, показників форми молекули, схожості орієнтаційного упорядкування і/або об'ємів перекриття. Аналіз 101338 структур призвів до ідентифікації восьми окремих хімічних детермінант, із молекулярною масою в діапазоні 150-230Да і імовірністю зустрічання в підмножині активних хімічних стр уктур завдяки чистому випадку менше ніж 1 на 10000 (р
ДивитисяДодаткова інформація
Назва патенту англійськоюMethod for a discrete substructural analysis and a computer system for realizing the same
Назва патенту російськоюСпособ дискретного структурно-фрагментарного анализа и компьютерная система для его осуществления
МПК / Мітки
МПК: G01N 33/50, G06F 19/00, C07C 233/44, C07C 335/00, G06F 17/50, C07C 323/32, G06F 17/30, C07B 61/00, C07C 39/00, G06F 17/18, G01N 33/48
Мітки: система, структурно-фрагментарного, спосіб, здійснення, аналізу, комп'ютерна, дискретного
Код посилання
<a href="https://ua.patents.su/43-79231-sposib-diskretnogo-strukturno-fragmentarnogo-analizu-ta-kompyuterna-sistema-dlya-jjogo-zdijjsnennya.html" target="_blank" rel="follow" title="База патентів України">Спосіб дискретного структурно-фрагментарного аналізу та комп’ютерна система для його здійснення</a>
Попередній патент: Спосіб лікування хронічного катарального гінгівіту
Випадковий патент: Черв'ячний редуктор