Что-то я разнылся в прошлом посте. И вообще, чего это я плачусь? Вона сам Бен Герцель (Ben Goertzel), которого некоторые считают современным Эйнштейном от искусственного интеллекта, за деньги говорит. Дайте, мол, $25M на команду из 33 человек и через 5 лет я вам покажу настоящий ИИ, сравнимый с человеческим. Сделаю, мол, виртуального младенца. Если хотите, переедем в Китай или Бразилию, чтобы уменьшить вдвое расходы.
Let's assume the project runs for 5 years. My bet is we can get an AGI toddler by that time. But even if that's wrong, I'm damn sure we could make amazing progress by that time, suitable to convince a large number of possible funding sources to continue funding the project at the same or a greater level.
И ведь не дают злодеи-упыри инвесторы! :) Требуют твердых гарантий, что через 5 лет, первого октября ровно в 0:01 изделие будет лежать на столе и нежно помигивать светодиодами. :)
А ведь, какая идея...
Короче, в Нашей Раше с искусственным интеллектом все плохо. То-ли климат неподходящий, то-ли активных титанов не осталось вроде Поспелова.
Однако, и на Западе, где титаны мысли еще могут выжить в дикой среде на подножном корме, сделать что-то радикально новое они уже не в состоянии. Время энтузиазма и больших проектов закончилось с постройкой Большого адронного коллайдера и разгромом космической программы НАСА. Настал век воинствующего консьюмеризма.
But it sure is frustrating to know that, for an amount of money that's essentially "pocket change" to a significant number of individuals and institutions on the planet, we could be progressing a lot faster toward some goals that are really important to all of us.
Хммм... а почему это Герцель в Китае осел... Как буду в Шанхае, надо будет поспрашивать прохожих. Может, там ИИ-шников любят? :)
С другой стороны, чем не супер-проект для программы мега-грантов и Сколково? Пригласили бы всей командой на ПМЖ в Россию и сразу шумиха в СМИ, прогресс... тем более, Бен там хочет делать AGI Sputnik :)
Хотите шутку? В списке приглашенных по программе мега-грантов в числе 40 мега-ученых оказались: 1 спец по биоинформатике, 1 по процессорам, 1 по вычислениям. С информационными науками всё. Спецов по ИИ там не числится. Прикольно, да? Сразу видно и востребованность ИИ в России, и мощь ИИ сообщества. Зато там есть 2 спеца по экологии, 4 по биологии, 4 по физике, 4 медицине.
Черт, опять начали за здравие, а кончили за упокой. Весна. Авитаминоз. Выпить что-ли...
Намедни читал материалы по Open Government. И про обещание и Обамы, и британского премьера публиковать в Интернет данные гос структур. И про то, как оно выполняется: Moving Data.gov towards the Semantic Web.
И так за державу обидно стало, аж жуть! Прямо даже в блог Президента захотелось написать. С просьбой обязать все государственные организации (корпорации, министерства, службы, ВУЗы) публиковать свою подробную отчетность на сайтах в формате RDF/OWL. В результате, получится распределенная гибкая база данных, и любой желающий сможет загрузить данные из нескольких организаций, сопоставить их и проанализировать.
Как сказал Тим Бернерс-Ли, делайте свои уеб-сайты, но сперва дайте нам ваши исходные данные. Нечего обнимать свою базу данных! Нет никаких извинений для закрытия данных! Нечего решать за нас, в каком виде лучше представить информацию! Raw Data Now!
А кроме того, можно сделать семантический поиск в режиме реального времени с хитрыми запросами вроде "вывести список всех чиновников, у которых жена владеет машиной дороже $1млн".
С одной стороны, это облегчит контроль за деятельностью чиновников со стороны общества в целом и личностей вроде Навального в частности. С другой -- создаст спрос на специалистов в области Semantic Web и интеллектуального анализа данных. С третьей, сами организации начнут использовать эти же интерфейсы для передачи данных между собой.
Да и сам Дмитрий Александрович сможет в реальном времени получать данные о работе гос-машины, которые будут обновляться сразу же, как только изменится информация на любом сайте-источнике данных.
А кроме того, может и средства на инновации начнут расходовать на реальные дела...
Куда ни посмотри -- сплошные плюсы от такого решения. Системный подход в действии :)
В общем, если к модернизации подходить системно, открытие всех данных гос машины в удобном формате должно быть первым шагом.
По идее, такие инфраструктурные решения -- это именно то, что и должно делать правительство для оптимизации своей работы. Ну не получается наладить механизм в духе Сталина, когда одни чиновники караулят малейшие промахи других. Сегодня им выгоднее договориться. Так давайте облегчим контроль со стороны общества. Со всем обществом не договоришься. Обязательно найдется Навальный :)
И самое главное, прецеденты уже есть. Ведь издал же Кириенко указ о внедрении стандарта ISO15926 в атомной промышленности для интеграции данных жизненного цикла изделия на основе общей онтологии. Практически то же самое. Только тут CADы, PLMы и прочие серьезные системы интегрируются.
Вот сейчас как заобъединим все свои данные и заживем, ой заживем!
Инженеру всегда интересно узнать, как оно устроено :) Итак, что же там внутри скрыто за гламурной планетой?
10 рэков с 90+ серверами IBM Power 750 (Linux);
суммарно 16 терабайт RAM;
суммарно 4 терабайт HDD;
2,880 ядер ЦП (80 teraflops);
200 млн страниц текста преобразованы в 500Гб структурированной информации, с которой работают 6 млн логических правил Prolog(?) при ответе на каждый вопрос;
время ответа менее 5 секунд;
без подключения к Интернет;
в основном на Java, значительные части на C++ и Prolog;
все интегрировано с помощью Apache UIMA -- open source проект платформы для анализа слабо структурированной информации вроде текстов (отдан в open source самой IBM в 2006 году).
Похоже, задачу решили методом brutforce: на одних и тех же данных параллельно проводится большое количество разных анализов и результаты объединяются в конечный ответ.
Проект стартовал в 2007 году (5 лет), команда из 15 человек в начале проекта и более 30 в конце, стандартное железо IBM, как утверждают, на миллион долларов.
От себя лично
...Несколько лет назад, когда я был молодой, глупый, голодный и злой (и изрядно напуганный бюрократической процедурой приема на работу в МГТУ, затянувшейся в моем случае на пол года), забрел как-то в Институт системного программирования РАН с похожей задумкой, только применительно к анализу исходного кода больших программных систем:
поднимаем исходный код системы в виде AST деревьев в память кластера;
параллельно анализируем его большим количеством агентов-анализаторов;
закономерности, найденные одними агентами могут быть эвристиками, направляющими и ускоряющими поиск других агентов;
в результате процесса анализатор понимает, из каких механизмов состоит анализируемая система и какую роль они играют в ее работе.
Таким образом можно было бы проанализировать большое количество open source проектов и собрать приличную базу знаний, содержащую конструкторские решения, ранее скрытые в коде. Причем, что интересно, в java-коммьюнити в каждой области есть несколько конкурирующих поектов с разными вариантами реализации примерно одного и того же функционала... есть, где развернуться.
А там уже и до автоматического синтеза реализации программы под руководством архитектора недалеко. Конечная цель: толковый архитектор в обнимку с супер-компьютером уровня Watson разоряет Microsoft, т.к. производительность труда такой человеко-машинной системы выше, чем у всей корпорации.
Но мы с учеными как-то не поняли друг друга. Они, по всей видимости, испугались фрика-одиночки, который не знает, как правильно пишется декартово произведение. А я тогда решил, что им и так хватает своих уютных проектов с Вымпелкомом и другими товарищами в собственном небольшом особнячке в центре Москвы.
В общем, первое свиданье закончилось полным провалом. С тех пор так и живем... порознь :) Каких-то других российских организаций, более-менее серьезно занимающихся формальными методами в разработке ПО, я в природе не встречал. По-тихоньку копаем в эту сторону со студентами. Model-driven development, domain-specific languages, формальные методы, Semantic Web, агенты. На энтузиазме. За голый интерес.
А ведь при должной поддержке мог бы выйти наш ответ Чемберлену: IBM выиграла бы Jeopardy, а Россия разорила бы мировой рынок ПО :) Ведь формальные тексты программ анализировать попроще, да и знаний можно вытащить побольше.
Вообще, интересно, кто бы мне дал в России 1 млн долл. на железо и еще 6,4 млн долл. на зарплаты 30 высококлассным спецам в течение 5 лет? В принципе, хоть кто-то в России готов вложить 6 млн долл. в такой проект? С учетом того, что суперкомпьютеров-то по указу Президента накупили, а загрузить их нечем: нету в стране таких задач, не нужны никому ни моделирование, ни анализ информации. Наверное, когда-нибудь российские олигархи начнут интересоваться не только крутыми тачками и уеб-сайтами, но и технологиями разработки ПО... дожить бы.
Хотя... может, оно и к лучшему, что ничего не получилось! А то напали бы на нас оказавшиеся в мгновенье ока безработными орды китайских, индийских и американских программистов... да и нашим российским php+mysql, когда они собираются голодной толпой, лучше на пути не попадаться.
Ну и ладно!
Не очень то и хотелось!
У меня теперь свое маленькое счастье: небольшая группа толковых студентов.
И вообще, есть новая задумка: Организатор Всего или Матрица :)
Несколько лет поколения студентов изучали агентную платформу Jade. И вот в недрах Интернета обнаружен неофициальный community перевод одного из руководств! А именно, JADE Programming For Beginners версии 3.6.
Возрадуемся же, братия! И да поможем друг другу с другими руководствами по JADE :) И да обновим же это руководство до версии 4.0.1! Ибо все в наших руках. И агенты, и Semantic Web.
Этот блог создан для привлечения русскоговорящей аудитории к технологии агентов и их возможностям с практической и научной точек зрения.
В блоге я постараюсь осветить основные вопросы, связанные с агентами. То есть, составить своеобразный краткий путеводитель в области агентов, который позволит сориентироваться новичкам и, возможно, расширит знания старичков.
PS. Если у Вас возникнут интересные вопросы -- смело связывайтесь со мной!
Новости блога
Подпишите свой e-mail клиент или новостной клиент на получение новых записей и Вы будете всегда в курсе всех публикаций этого блога!