Топ новостей


РЕКЛАМА



Календарь

Wolfram Alpha - знає комп'ютер

У травні була запущена машина, що обчислює знання (computational knowledge engine), що отримала назву Wolfram | Alpha (www.wolframalpha.com). Wikipedia відносить цю програму до класу answer engine, тобто «машина для відповідей», що формально ставить її в одну категорію з сайтами AskMeNow, BrainBoost, DeeperWeb і True Knowledge, хоча насправді це не так. Машина дійсно призначена для відповідей, але не заготовлених заздалегідь, а що обчислюються за запитом.

Машина дійсно призначена для відповідей, але не заготовлених заздалегідь, а що обчислюються за запитом

Поки що рано виносити обгрунтоване судження про можливості машини, але складається враження, що Wolfram | Alpha дійсно вміє витягати знання, правда при цьому на перших порах особливим багатством інтелектуального багажу не відрізняється. Говорити про те, що вона може скласти конкуренцію Google, передчасно, та й неправильно - це продукт зовсім іншого класу. Wolfram | Alpha не шукає сторінки за ключовими словами, а відповідає на питання. Якщо ви її спитаєте про погоду в Москві, то вона запропонує вам не список метеосайтов, а поточний прогноз і довідку про московському кліматі.

Стівен Вольфрам народився в 1959 році в інтелігентній єврейській родині, яка емігрувала в 1933-му з Німеччини до Британії. Його батько - маловідомий письменник, а мати була викладачем філософії в Оксфорді. Вольфрам був справжнім вундеркіндом, в дитинстві його навіть називали «маленьким Ейнштейном», і цю честь він виправдав ще в юності, написавши свою першу книгу з експериментальної фізики в віці чотирнадцяти років, а першу серйозну наукову статтю, опубліковану в журналі Nuclear Physics, - в сімнадцять, нарешті, науковий ступінь він отримав в двадцять років. Однак фізиком Вольфрам не став і наступні три десятиліття своєї наукової кар'єри майже повністю присвятив клітинним автоматам (КА), запропонованим Джоном фон Нейманом. Спрощено клітинний автомат можна представити як безліч осередків, кожна з яких, або елементарний автомат, здатна приймати одне з кінцевого набору значень (скажімо, 0 і 1), цей стан може змінюватися за певними правилами, в залежності від стану сусідніх осередків і часу. По всій видимості, КА - один з кращих засобів для моделювання життя, не випадково найбільш відомими прикладами клітинних автоматів є найрізноманітніші ігри, від «хрестиків-нуликів» до шахів. Взагалі будь-яку гру, яка відбувається на полі з клітинами, слід визнати клітинним автоматом; в науці ж найбільшу популярність здобув автомат «Життя», запропонований Джоном Конвеем.

До 1986 року Вольфрам працював в Інституті передових досліджень (Institute for Advanced Study, IAS) - тому самому закладі, який в Сполучених Штатах спеціально створено в кінці 40-х років в якості притулку для вчених емігрантів, серед яких були Альберт Ейнштейн, фон Нейман, Роберт Оппенгеймер і інші представники європейської науки До 1986 року Вольфрам працював в Інституті передових досліджень (Institute for Advanced Study, IAS) - тому самому закладі, який в Сполучених Штатах спеціально створено в кінці 40-х років в якості притулку для вчених емігрантів, серед яких були Альберт Ейнштейн, фон Нейман, Роберт Оппенгеймер і інші представники європейської науки. Це місце дивовижних зустрічей і перетину доль, немає нічого дивного в тому, що тут Вольфрам разом з Річардом Фейнманом моделював фізичні процеси методами клітинних автоматів. Матеріальною базою служив комп'ютер CM-1, що випускався компанією Thinking Machines. Цей комп'ютер можна вважати першим прикладом реалізації архітектури з масовим паралелізмом SIMD; число процесорів в CM-1 могло бути доведено до 65536 (втім, цим показником особливо дивуватися не варто - процесори були найпростішими, однобітових).

Після відходу з Інституту передових досліджень Вольфрам змінив академічної кар'єрі і в 1987 році заснував існуючий донині міждисциплінарний науковий журнал Complex Systems ( «Складні системи»), де висвітлюються різні системні аспекти біології, комп'ютерної науки, фізики та математики. Роком пізніше він створив компанію Wolfram Research, яка постачає популярний математичний пакет Mathematica, конкуренцію яким складають три продукти - Maple, Mathcad і MATHLAB. З тих пір Вольфрам успішно поєднує бізнес з наукою. З листопада 2008 року його компанія випускає версію Mathematica 7, а також три доповнюють її продукту Wolfram Workbench, gridMathematica і webMathematica. Штаб-квартира компанії розташована в Великобританії, є дослідницький підрозділ в Японії, є свій видавничий бізнес. Серед книг є «головна», видана в 2002 році і напісанняа самим Вольфрам. Її досить претензійне видання A New Kind of Science ( «Новий клас науки») проголошує, що гряде наукова революція, викликана прогресом клітинних автоматів. Звучить дивно, але: «Революція здається абсолютно неможливою 'до' і абсолютно неминучою 'після'». Цей величезний том, обсягом понад 1200 сторінок, до сих пір займає чільне місце на прилавках американських магазинів, правда, зараз він подешевшав удвічі. Повинен зізнатися, що я cам неодноразово тримав його в руках, але від покупки стримував розмір, вага і форма викладу, багата жахливим кількістю малюнків. Книга, що отримала власний нік NKS, заслужила різні, часто полярні відгуки, але, погодимося, автор з послужним списком Вольфрама заслуговує до себе вдумливого ставлення.

В умовах абсолютної таємничості, над розробкою Computational knowledge engine працювало більше сотні людей протягом п'яти років. Стверджується, що система Wolfram | Alpha заснована на роботі з природними мовами і для вилучення знань і підготовки відповідей використовує бібліотеку алгоритмів, побудованих на підходах, описаних в NKS. Один з піонерів Semantic Web Нова Співак після бесіди з Вольфрам стверджував: «... Wolfram | Alpha не менше значна, ніж Google, але це не 'вбивця Google', у неї інша функція, Alpha НЕ пошукова машина, а машина, що дає відповіді на задані їй питання ». На відміну від всіх інших пошукачів система Wolfram | Alpha дійсно відповідає на поставлені їй питання, вона не повертає документи з відповідями, як Google і інші, не є величезною базою знань як Wikipedia, або механізмом для доступу до цієї бази на природній мові, як система Powerset. Найближче до Wolfram | Alpha бібліотека знань Сyc.

Немає нічого дивного, що Дуглас Ленат, творець Cyc, фахівець в області штучного інтелекту і директор компанії Cycorp, був одним з перших, кому Вольфрам продемонстрував своє створення, після чого Ленат в своєму блозі відкрив покрив таємничості. Сам Вольфрам публічно не поширюється про технології обчислення знань, тому доводиться довіряти інтерпретації тих, хто отримав відомості про них з перших рук. За Ленат, в серцевині перебуває подання знань в форматах, які використовуються в Mathematica, тобто створених вручну записах, які акумулюють в собі відомості з певної галузі знань, наприклад тих чи інших даних з економіки, зібраних в самій Wolfram | Alpha. На відміну від Semantic Web, який перенаправляє запит на сторонній джерело інформації, який він обирає, тут використовується виключно «опора на власні сили». Отже, Wolfram | Alpha є логічним продовженням Mathematica, розширюючи предметну область, яка раніше охоплювала тільки математичні поняття, а тепер включає реалії з зовнішнього світу. Загальним же є те, що Wolfram | Alpha не одержує якісь дані, а виконує над ними обчислення і представляє результати в текстовій, табличній і графічній формі. Таким чином, перекривається простір потенційних запитів. Для обчислення відповідей на питання в системі є вбудована модель, що складається з окремих полів, наборів даних і алгоритмів, в якій втілено знання про реальний світ, наприклад звід знань з фізики або хімії. З питання і по моделі виробляється обчислення. Галузь знань не обмежена наукою, в неї може входити музика, кулінарія, бізнес, все, що завгодно. У будь-якому випадку створюється формальна система знань, з неї за запитом витягуються відповіді, які і пропонуються в неформальному вигляді.

За формою запити можна уподібнити DWIM (Do What I Mean) або DWIMM (Do What I Might Mean), тобто «зроби те, що я маю на увазі» - або «те, що я міг би мати на увазі». Так колись називали наївні спроби непосвячених змусити комп'ютер робити не те, що він може, а то, що хочеться. Але в даному випадку підхід працює наприклад, якщо ви введете gdp (gross domestic product), то в залежності від того, в якій країні ви перебуваєте, будуть видані цифри і динаміка валового внутрішнього продукту. Хоча стверджується, що запити можна формулювати на природній мові, це не зовсім так. Ні суворого синтаксису і словника, але вміти ставити питання потрібно і потрібно знати потенціал Wolfram | Alpha.

Порівнюючи Wolfram | Alpha з Google і Cyc, Ленат робить наступний висновок. Пошукова система Google передає дані, не вникаючи в них, грунтуючись на формальній відповідності. Система з штучним інтелектом Cyc зможе дати глибокий відповідь, якщо ви, в свою чергу, зможете їй задати питання і при цьому потрапите в ту область, яку вона знає. Wolfram | Alpha є чимось середнім. Прийдешні перспективи системи в сильному ступені залежать від того, наскільки продуктивним виявиться ідея формування бази знань силами самої компанії, чи вдасться з подібним суто пропрієтарним підходом протистояти відкритого редагування, прийнятому в Wikipedia і інших мережевих енциклопедіях.

Бібліотека знань Сyc

У всіх хроніках робіт по штучному інтелекту можна знайти згадки про проект Cyc, який нерідко порівнюють з комп'ютером HAL, описаним Артуром Кларком в «Космічній одіссеї 2001 року», а тепер бібліотека знань Cyc доступна всім і, можливо, приверне до себе набагато більшу увагу.


Реклама



Новости