среда, 9 марта 2011 г.

Даешь Герцеля в Сколково!

Что-то я разнылся в прошлом посте. И вообще, чего это я плачусь? Вона сам Бен Герцель (Ben Goertzel), которого некоторые считают современным Эйнштейном от искусственного интеллекта, за деньги говорит. Дайте, мол, $25M на команду из 33 человек и через 5 лет я вам покажу настоящий ИИ, сравнимый с человеческим. Сделаю, мол, виртуального младенца. Если хотите, переедем в Китай или Бразилию, чтобы уменьшить вдвое расходы.

Let's assume the project runs for 5 years. My bet is we can get an AGI toddler by that time. But even if that's wrong, I'm damn sure we could make amazing progress by that time, suitable to convince a large number of possible funding sources to continue funding the project at the same or a greater level.

И ведь не дают злодеи-упыри инвесторы! :) Требуют твердых гарантий, что через 5 лет, первого октября ровно в 0:01 изделие будет лежать на столе и нежно помигивать светодиодами. :)

А ведь, какая идея...



Короче, в Нашей Раше с искусственным интеллектом все плохо. То-ли климат неподходящий, то-ли активных титанов не осталось вроде Поспелова.

Однако, и на Западе, где титаны мысли еще могут выжить в дикой среде на подножном корме, сделать что-то радикально новое они уже не в состоянии. Время энтузиазма и больших проектов закончилось с постройкой Большого адронного коллайдера и разгромом космической программы НАСА. Настал век воинствующего консьюмеризма.

But it sure is frustrating to know that, for an amount of money that's essentially "pocket change" to a significant number of individuals and institutions on the planet, we could be progressing a lot faster toward some goals that are really important to all of us.

Хммм... а почему это Герцель в Китае осел... Как буду в Шанхае, надо будет поспрашивать прохожих. Может, там ИИ-шников любят? :)


С другой стороны, чем не супер-проект для программы мега-грантов и Сколково? Пригласили бы всей командой на ПМЖ в Россию и сразу шумиха в СМИ, прогресс... тем более, Бен там хочет делать AGI Sputnik :)

Хотите шутку? В списке приглашенных по программе мега-грантов в числе 40 мега-ученых оказались: 1 спец по биоинформатике, 1 по процессорам, 1 по вычислениям. С информационными науками всё. Спецов по ИИ там не числится. Прикольно, да? Сразу видно и востребованность ИИ в России, и мощь ИИ сообщества. Зато там есть 2 спеца по экологии, 4 по биологии, 4 по физике, 4 медицине.

Черт, опять начали за здравие, а кончили за упокой. Весна. Авитаминоз. Выпить что-ли...

среда, 2 марта 2011 г.

Open Government или Госслужбы, отдайте свои данные

Намедни читал материалы по Open Government. И про обещание и Обамы, и британского премьера публиковать в Интернет данные гос структур. И про то, как оно выполняется: Moving Data.gov towards the Semantic Web.



И так за державу обидно стало, аж жуть! Прямо даже в блог Президента захотелось написать. С просьбой обязать все государственные организации (корпорации, министерства, службы, ВУЗы) публиковать свою подробную отчетность на сайтах в формате RDF/OWL. В результате, получится распределенная гибкая база данных, и любой желающий сможет загрузить данные из нескольких организаций, сопоставить их и проанализировать.

Как сказал Тим Бернерс-Ли, делайте свои уеб-сайты, но сперва дайте нам ваши исходные данные. Нечего обнимать свою базу данных! Нет никаких извинений для закрытия данных! Нечего решать за нас, в каком виде лучше представить информацию! Raw Data Now!



А кроме того, можно сделать семантический поиск в режиме реального времени с хитрыми запросами вроде "вывести список всех чиновников, у которых жена владеет машиной дороже $1млн".




С одной стороны, это облегчит контроль за деятельностью чиновников со стороны общества в целом и личностей вроде Навального в частности. С другой -- создаст спрос на специалистов в области Semantic Web и интеллектуального анализа данных. С третьей, сами организации начнут использовать эти же интерфейсы для передачи данных между собой.

Да и сам Дмитрий Александрович сможет в реальном времени получать данные о работе гос-машины, которые будут обновляться сразу же, как только изменится информация на любом сайте-источнике данных.

А кроме того, может и средства на инновации начнут расходовать на реальные дела...
Куда ни посмотри -- сплошные плюсы от такого решения. Системный подход в действии :)

В общем, если к модернизации подходить системно, открытие всех данных гос машины в удобном формате должно быть первым шагом.

По идее, такие инфраструктурные решения -- это именно то, что и должно делать правительство для оптимизации своей работы. Ну не получается наладить механизм в духе Сталина, когда одни чиновники караулят малейшие промахи других. Сегодня им выгоднее договориться. Так давайте облегчим контроль со стороны общества. Со всем обществом не договоришься. Обязательно найдется Навальный :)

И самое главное, прецеденты уже есть. Ведь издал же Кириенко указ о внедрении стандарта ISO15926 в атомной промышленности для интеграции данных жизненного цикла изделия на основе общей онтологии. Практически то же самое. Только тут CADы, PLMы и прочие серьезные системы интегрируются.


Вот сейчас как заобъединим все свои данные и заживем, ой заживем!

воскресенье, 27 февраля 2011 г.

Вассерман автоматизирован! Шокирующие подробности!

16 февраля 2011 года компьютер компании IBM впервые победил человеков в игре Jeopardy (аналог Своя игра).



Webplanet о событии: Люди проиграли машине в Jeopardy!

Компьютерра о событии (в основном, перевод Википедии): Суперкомпьютер IBM Watson: элементарно, Ватсон

Анатолий Левенчук о событии:
Подробности матча IBM Watson в Jeopardy!
Второй день матча IBM Watson
Третий день матча IBM Watson -- и он официально стал лучшим отвечайкой мира

Сайт проекта: IBM Watson

О том, как все устроено и работает:
IBM Watson Research Team Answers Your Questions
Apache Innovation Bolsters IBM's "Smartest Machine on Earth" in First-ever Man vs. Machine Competition on Jeopardy! Quiz Show

Инженеру всегда интересно узнать, как оно устроено :) Итак, что же там внутри скрыто за гламурной планетой?
  • 10 рэков с 90+ серверами IBM Power 750 (Linux);
  • суммарно 16 терабайт RAM;
  • суммарно 4 терабайт HDD;
  • 2,880 ядер ЦП (80 teraflops);
  • 200 млн страниц текста преобразованы в 500Гб структурированной информации, с которой работают 6 млн логических правил Prolog(?) при ответе на каждый вопрос;
  • время ответа менее 5 секунд;
  • без подключения к Интернет;
  • в основном на Java, значительные части на C++ и Prolog;
  • все интегрировано с помощью Apache UIMA -- open source проект платформы для анализа слабо структурированной информации вроде текстов (отдан в open source самой IBM в 2006 году).

Похоже, задачу решили методом brutforce: на одних и тех же данных параллельно проводится большое количество разных анализов и результаты объединяются в конечный ответ.

Проект стартовал в 2007 году (5 лет), команда из 15 человек в начале проекта и более 30 в конце, стандартное железо IBM, как утверждают, на миллион долларов.

От себя лично
...Несколько лет назад, когда я был молодой, глупый, голодный и злой (и изрядно напуганный бюрократической процедурой приема на работу в МГТУ, затянувшейся в моем случае на пол года), забрел как-то в Институт системного программирования РАН с похожей задумкой, только применительно к анализу исходного кода больших программных систем:
  • поднимаем исходный код системы в виде AST деревьев в память кластера;
  • параллельно анализируем его большим количеством агентов-анализаторов;
  • закономерности, найденные одними агентами могут быть эвристиками, направляющими и ускоряющими поиск других агентов;
  • в результате процесса анализатор понимает, из каких механизмов состоит анализируемая система и какую роль они играют в ее работе.

Таким образом можно было бы проанализировать большое количество open source проектов и собрать приличную базу знаний, содержащую конструкторские решения, ранее скрытые в коде. Причем, что интересно, в java-коммьюнити в каждой области есть несколько конкурирующих поектов с разными вариантами реализации примерно одного и того же функционала... есть, где развернуться.

А там уже и до автоматического синтеза реализации программы под руководством архитектора недалеко. Конечная цель: толковый архитектор в обнимку с супер-компьютером уровня Watson разоряет Microsoft, т.к. производительность труда такой человеко-машинной системы выше, чем у всей корпорации.

Но мы с учеными как-то не поняли друг друга. Они, по всей видимости, испугались фрика-одиночки, который не знает, как правильно пишется декартово произведение. А я тогда решил, что им и так хватает своих уютных проектов с Вымпелкомом и другими товарищами в собственном небольшом особнячке в центре Москвы.

В общем, первое свиданье закончилось полным провалом. С тех пор так и живем... порознь :) Каких-то других российских организаций, более-менее серьезно занимающихся формальными методами в разработке ПО, я в природе не встречал. По-тихоньку копаем в эту сторону со студентами. Model-driven development, domain-specific languages, формальные методы, Semantic Web, агенты. На энтузиазме. За голый интерес.

А ведь при должной поддержке мог бы выйти наш ответ Чемберлену: IBM выиграла бы Jeopardy, а Россия разорила бы мировой рынок ПО :) Ведь формальные тексты программ анализировать попроще, да и знаний можно вытащить побольше.

Вообще, интересно, кто бы мне дал в России 1 млн долл. на железо и еще 6,4 млн долл. на зарплаты 30 высококлассным спецам в течение 5 лет? В принципе, хоть кто-то в России готов вложить 6 млн долл. в такой проект? С учетом того, что суперкомпьютеров-то по указу Президента накупили, а загрузить их нечем: нету в стране таких задач, не нужны никому ни моделирование, ни анализ информации. Наверное, когда-нибудь российские олигархи начнут интересоваться не только крутыми тачками и уеб-сайтами, но и технологиями разработки ПО... дожить бы.

Хотя... может, оно и к лучшему, что ничего не получилось! А то напали бы на нас оказавшиеся в мгновенье ока безработными орды китайских, индийских и американских программистов... да и нашим российским php+mysql, когда они собираются голодной толпой, лучше на пути не попадаться.

Ну и ладно!
Не очень то и хотелось!
У меня теперь свое маленькое счастье: небольшая группа толковых студентов.
И вообще, есть новая задумка: Организатор Всего или Матрица :)

понедельник, 21 февраля 2011 г.

На русском -- JADE Programming For Beginners

Несколько лет поколения студентов изучали агентную платформу Jade. И вот в недрах Интернета обнаружен неофициальный community перевод одного из руководств! А именно, JADE Programming For Beginners версии 3.6.

Возрадуемся же, братия! И да поможем друг другу с другими руководствами по JADE :) И да обновим же это руководство до версии 4.0.1! Ибо все в наших руках. И агенты, и Semantic Web.