• Что можно приготовить из кальмаров: быстро и вкусно

    Тест Тьюринга – это тест, как следует из названия, предложенный Аланом Тьюрингом, для определения обладает ли машина интеллектом. Тьюринг решил, что нет смысла разрабатывать обширный список требований, необходимых для создания искусственного интеллекта, который к тому же может оказаться противоречивым, и предложил тест, основанный на том, что поведение объекта, обладающего искусственным интеллектом, в конечном итоге нельзя будет отличить от поведения таких бесспорно интеллектуальных сущностей, как человеческие существа. Компьютер успешно пройдет тест Тьюринга, если человек-экспериментатор, задавший ему в письменном виде определенные вопросы, не сможет определить, получены ли письменные ответы от другого человека или от некоторого устройства. На данный момент составление программы для компьютера, чтобы он прошел тест Тьюринга, требует большого объема работы. Запрограммированный таким образом компьютер должен включать в себя:

    • средства обработки текстов на естественных языках (Natural Language Processing – NLP), позволяющие успешно общаться с компьютером, скажем на английском языке;
    • средства представления знаний, с помощью которых компьютер может записать в память то, что он узнает или прочитает;
    • средства автоматического формирования логических выводов, обеспечивающие возможность использовать хранимую информацию для поиска ответов на вопросы и вывода новых заключений;
    • средства машинного обучения, которые позволяют приспосабливаться к новым обстоятельствам, а также обнаруживать и экстраполировать признаки стандартных ситуаций.

    В тесте Тьюринга сознательно исключено непосредственное физическое взаимодействие экспериментатора и компьютера, поскольку для создания искусственного интеллекта не требуется физическая имитация человека. Но в так называемом полном тесте Тьюринга предусмотрено использование видеосигнала для того, чтобы экспериментатор мог проверить способности испытуемого объекта к восприятию, а также имел возможность представить физические объекты «в неполном виде» (пропустить их «через штриховку»).

    Тьюринг предсказывал, что компьютеры в конечном счёте пройдут его тест. Он считал, что к 2000 году компьютер с памятью 1 миллиард бит (около 119 МБ) в ходе 5-минутного теста сможет обмануть судей в 30 % случаев.

    Это предсказание не сбылось. Тьюринг также предсказал, что сочетание «мыслящая машина» не будет считаться оксюмороном, а обучение компьютеров будет играть важную роль в создании мощных компьютеров (с чем большинство современных исследователей согласны).

    Пока что ни одна программа и близко не подошла к прохождению теста Тьюринга. Такие программы, как Элиза (ELIZA), иногда заставляли людей верить, что они говорят с человеком, как, например, в неформальном эксперименте, названном AOLiza. Но такие «успехи» не являются прохождением теста Тьюринга. Во-первых, человек в таких беседах не имел никаких оснований считать, что он говорит с программой, в то время как в настоящем тесте Тьюринга человек активно пытается определить, с кем он беседует. Во-вторых, документированные случаи обычно относятся к таким чатам, где многие беседы отрывочны и бессмысленны. В-третьих, многие пользователи чатов используют английский как второй или третий язык, и бессмысленный ответ программы, вероятно, спишется ими на языковый барьер. В-четвертых, многие пользователи ничего не знают об Элизе и ей подобных программах и не могут распознать совершенно нечеловеческие ошибки, которые эти программы допускают.

    Ежегодно производится соревнование между разговаривающими программами и наиболее человекоподобной, по мнению судей, присуждается приз Лебнера. Есть также дополнительный приз для программы, которая, по мнению судей, пройдет тест Тьюринга. Этот приз еще не присуждался. Самый лучший результат показала программа A.L.I.C.E. выиграв приз Лебнера 3 раза (в 2000, 2001 и 2004).

    Несмотря на то, что прошло больше 50 лет, тест Тьюринга не потерял своей значимости. Но в настоящее время исследователи искусственного интеллекта практически не занимаются решением задачи прохождения теста Тьюринга, считая, что гораздо важнее изучить основополагающие принципы интеллекта, чем продублировать одного из носителей естественного интеллекта. В частности, проблему «искусственного полета» удалось успешно решить лишь после того, как братья Райт и другие исследователи перестали имитировать птиц и приступили к изучению аэродинамики. В научных и технических работах по воздухоплаванию цель этой области знаний не определяется как «создание машин, которые в своем полете настолько напоминают голубей, что даже могут обмануть настоящих птиц».

    Компьютерная программа, убедила людей, что она является 13-летним мальчиком и тем самым стала первой программой, прошедшей тест Тьюринга.

    Тьюринг создал тест для определения того, может ли машина мыслить.

    Оригинальный тест состоит в следующем. Человек в течении 5 минут общается с одним компьютером и одним человеком. Получая ответы на вопросы, человек должен определить, что разговаривает с человеком или компьютерной программой. Задачей компьютерной программы является ввести человека в заблуждение, чтобы тот сделал ошибочный выбор.

    Участники теста не видят друг друга. В случае, если судья не может точно сказать, кто из собеседников человек, то считается, что компьютер прошел тест. Беседа ведется в режиме «только текст», например, с помощью клавиатуры и экрана (второстепенного компьютера). Это необходимо, чтобы протестировать именно интеллект машины, а не её возможность распознавать устную речь. Переписка производится через контролируемые промежутки времени, чтобы судья не мог делать заключения, исходя из скорости ответов (в наши дни компьютеры реагируют быстрее чем человек).

    Для прохождения теста необходимо, чтобы компьютерная программа смогла обмануть 30 процентов людей.

    Компьютерная программа «Евгений Густман», создана командой разработчиков из России, прошла тест, проведенный в Королевском обществе в Лондоне. Она убедила 33 процента судей, в том, что она является 13-летним мальчиком из Одессы, сообщили ученые из Университета Рединга, которые организовали этот тест.

    «Наша главная идея заключалась в том, что он может утверждать, что чего-то не знает, в его возрасте действительно он может не знать каких-то вещей» — сказал Владимир Веселов, один из создателей программы, - «Мы потратили много времени на разработку правдоподобного персонажа.»

    Успех программы, скорее всего, создаст некоторые опасения по поводу будущего компьютеров, сказал Кевин Уорвик, профессор Университета Рединга и проректор по исследовательской работе в университете Ковентри.

    «В области искусственного интеллекта нет более знаковых и противоречивых этапов, чем тест Тьюринга, когда компьютер убеждает достаточное количество судей, в том, что это не машина, а человек» — сказал он. «Имея компьютер, который может обмануть человека, заставить его подумать, что кто-то или даже что-то является человеком, это является тревожным сигналом, связанным с киберпреступностью. Тест Тьюринга является очень важным инструментом для борьбы с этой угрозой. Важно полностью понять, как общение в Интернете в реальном времени может ввести в заблуждение человека, полагающего истинность что-то в то время, когда на самом деле это не так.»

    В тесте, организованном в Королевском обществе в субботу, принимало участие пять программ. Судьями были актер Robert Llewellyn, который играл робота Kryten в «Красном карлике» (научная комедия телеканала BBC), и лорд Шарки, который возглавлял кампанию, целью которой была посмертная реабилитация Алана Тьюринга в прошлом году.

    Алан Тьюринг представил свой тест в 1950 в статье, «Вычислительная техника и разум». В ней он заявил, из-за того, что «мышление» трудно определить, важно, сможет ли компьютер имитировать реальное человеческое существо. С тех пор он стал одним из ключевых элементов философии искусственного интеллекта.

    Успех пришел на 60-летие со дня смерти Тьюринга, в субботу 07.06.2014 года.

    Источник: The Independent

    P.S. Самостоятельно проверить насколько умна эта программа можно на сайте лаборатории искусственного интеллекта Принстонского университета. Лично у меня не сложилось впечатления что я разговариваю с человеком, пусть даже и с ребенком. Так что тест Тьюринга, мне кажется, не совсем еще пройден.

    Как вы оцениваете эту публикацию?

    18 апреля 2013 в 16:26

    Самый большой тест Тьюринга

    • Искусственный интеллект

    23 июня 2012 года Алану Тьюрингу исполнилось бы 100 лет. И хотя эта дата осталось незамеченной в России (и на Хабре), ее широко отмечали в зарубежном научном сообществе. 2012 год бы провозглашен годом Алана Тьюринга . В праздновании юбилея приняли участие многочисленные университеты, научные лаборатории, ассоциации, коммерческие компании. Он включил в себя лекции, конференции, выставки, фильмы, книги, написание стихов, посвященных Тьюрингу, учреждение стипендий, а так же различные соревнование. Одно из соревнований особенно привлекло мое внимание: Turing100 - очень масштабный тест Тьюринга. Это было самое большое соревнование среди примерно 150 тестов Тьюринга, проведенных к сегодняшнему дню. Обычно в тесте Тьюринга участвуют четыре системы и четверо судей. В соревновании Turing100 приняли участие пять чат-ботов, 30 судей и 25 скрытых человек.

    Turing 100 был организован Университетом Рединга (Великобритания). Университет - один из европейских центров, занимающихся искусственным интеллектом, уже проводил премию Лебнера в 2008 году. Организаторы конкурса: Кевин Ворвик и Хума Шах в данный момент участвуют в проекте RoboLaw - Регулирование новых роботизированных технологий в Европе: закон и этика для роботов.

    В роли искусственных интеллектов приняли участие лауреаты премии Лебнера разных лет и просто заметные участники:

    • Elbot the Robot www.elbot.com
    • Eugene Goostman www.princetonai.com/bot/bot.jsp

    Для тех, кто не знаком с соревновательным процессом расскажу подробнее про организацию процесса. Соревнование проходило в 5 сессий. Каждая сессия длилась пять минут, по истечении времени сессию отключали строго по таймеру. Было два типа тестов: разговор один на один с невидимым собеседником (скрытым человеком или программой) и с двумя на разделенном мониторе. В обоих случаях судье предлагалось решить, с кем или чем он имеет дело, в сдвоенной беседе могло быть как две машины, так и два человека. Скрытые люди были проинструктированы вести себя естественно и не пытаться подражать компьютерам. В конце концов конкурс проводится для того, чтобы машины притворялись людьми, а не наоборот. Начинал разговор всегда судья, взаимодействие должно было осуществляться строго по одной реплике. Нельзя было отправлять вторую, не дождавшись ответа на первую.

    Такие строгие рамки как раз и позволяют программам быстро сбивать с толку судей. Впрочем, и судьи расставляют ловушки.
    Один из скрытых людей Мэтт Уитби был в тупике, когда его спросили: «Я переел жаренной картошки. Должен ли я увидеть пожарного?». Часто задавали вопросы об окружающей обстановке «Солнечно ли на улице?», «Холодно ли в комнате?».

    Всего было проведено более 150 взаимодействий между программами, судьями и тайными людьми. Такая большая выборка сделала результаты именно этого соревнования более статистически значимыми, чем стандартные тесты Тьюринга.

    Победителем Turing100 стал Eugene Goostman, до этого занимавший высокие места, включая несколько вторых, но еще ни разу не выигрывавший. Ему удалось обмануть судей в 29% случаев. Как отмечает один из судей , успех Юджина обусловлен довольно проработанной личностью бота: он притворяется 13-тилетним мальчиком из Одессы, с морской свинкой и отцом гинекологом.

    Смещение в сторону характера, конечно, демонстрирует уклон в развитии чатботов в сторону имитации и притворства, а не развития собственно диалоговых способностей. Было бы интересно сравнить возможности Юджина с включенной и отключенной «личностью». По результатам конкурса организаторы Хума Шах и Кевин Уорвик получили довольно большой корпус данных, и постепенно публикуют различные аналитические работы. К сожалению, пока опубликовано довольно мало результатов. Из уже доступного наиболее интересным результатом мне показалось то, что носители английского чаще принимали за машину тех, кто выучил английский (пусть и очень хорошо) и наоборот, люди, владеющие английским как вторым языком чаще считали чат-ботом именно носителей английского, как родного. Этот результат еще раз подчеркивает важность речи, как одного из основных каналов восприятия собеседника, учитывая, что это чувствуется даже в коротких пятиминутных письменных диалогах.

    Ну и в заключение, я початилась по пять минут с каждой из систем (кроме Фреда, мне почему-то не удалось его запустить).
    Ниже интересные выдержки из наших диалогов. Пожалуй, я согласна с судьями, Юджин действительно выглядит человечнее остальных. Кроме того, что он многословнее и эмоциональнее остальных, его «речевые способности» кажутся тоже более продвинутыми. Он запоминает контекст, может поддержать тему на протяжении нескольких реплик, меняет направление разговора довольно ненавязчиво. Так что, похоже, что дело тут не только в морской свинке.

    Cleverbot

    Me: You like movies?
    Cl: Yes.
    Me: Which one the most?
    Cl: Fenerbahce.
    Me: What is it?
    Cl: I think it is a word muncher.
    Me: Fenerbahce?
    Cl: What is that?
    Me: You told it"s your favourite movie.
    Cl: No, I didn"t.

    Ultra Hal

    Me: Do you like movies?
    UH: I enjoy a good movie.
    Me: Which one the most?
    UH: Hmm. I don"t know!
    Me: Think about it!
    UH: I"ll buy everything if you want. *laugh*.
    Me: I"m not selling anything!
    UH: Look at your life.
    Me: So what?
    UH: I don"t know.
    Me: Why you told me to look at my life?
    UH: I am so sympathetic with your lucky life.

    Me: Do you like movies?
    El: Blade Runner is a cult classic for us robots. The director created a robot cut especially for us!
    Me: Why you like it?
    El: Because...because....grrrrrrrr… I forgot. All this electromagnetic radiation around here is giving me chronic fatigue syndrome.
    Me: Memory loss?
    El: I realize this is a typical marketing question, but I"m supposed to ask it, otherwise they"ll use the low-grade oil on me. So, where did you find out about me?
    Me: I read about Turing test.
    El: Ah the Turing Test. People are always trying to get me to take it, but I just pretend not to understand.
    Me: You are doing a good job.
    El: Why, thank you very much. I like you, too. If I could have a pet you would be my first choice.

    Eugene Goostman
    Me: Hello!
    EG: Hello, I"m really glad to have the chance to chat with you! My guinea pig Bill sends his regards too!
    Me: Do you like movies?
    EG: I like comedies and find action movies to be stupid. As for the thrillers - I always fall asleep while watching them.
    Me: Which one the most?
    EG: I can"t make a choice right now. I should think it out later. Wonna ask me something more?
    Me: Just take your time and think abouit it.
    EG: Dummy statement.
    Me: Don"t be rude!
    EG: All we use more brutal words when we don"t see each other. I think it"s a kind of psychological law. If I"m not mistaken - you still didn"t tell me where you live. OR it"s a secret?:-)
    Me: I live in Moscow.
    EG: Moscow? Hope it"s a good place to live.
    Me: So so.
    EG: What are any interesting site-seeings in Moscow?
    Me: The Kremlin.
    EG: By the way, have you heard how one Russian on-line translator translates «Bin Laden»? It says - «Trashcan is full!»:-)))
    Me: Really? It"s funny!
    EG: No, it was extremely serious.

    Эмпирический эксперимент, в ходе которого человек общается с компьютерной интеллектуальной программой, которая моделирует ответы как человек.

    Предполагается, что тест Тьюринг пройден, если человек при общении с машиной считает, что общается с человеком, а не машиной.

    Британский математик Алан Тьюринг в 1950 г. придумал такой эксперимент по аналогии с имитационной игрой, которая предполагает, что 2 человека уходят в разные комнаты, а 3й человек должен понять кто где, общаясь с ними письменно.

    Тьюринг предложил такую игру провести с машиной и, если машина сможет ввести в заблуждение эксперта, это будет означать, что машина может думать. Таким образом, классический тест проходит по следующему сценарию:

    Человек-эксперт общается через чат с чат-ботом и другими людьми. По окончании общения эксперт должен понять, кто из собеседников был человеком, а кто — ботом.

    В наше время тест Тьюринга получил много разных модификаций, рассмотрим некоторые из них:

    Обратный тест Тьюринга

    Тест заключается в выполнении каких- либо действий для подтверждения, что ты человек. Н-р, мы можем часто сталкиваться с потребностью ввести цифры и буквы в специальное поле с искаженного изображения с набором цифр и букв. Данные действия защищают сайт от ботов. Прохождение данного теста подтверждало бы способность машины воспринимать сложные искаженные изображения, но пока таких не существует.

    Тест бессмертия

    Тест заключается в максимальном повторении личностных характеристик человека. Считается, что если характер человека максимально качественно скопирован, и его невозможно отличить от источника, то означает, что пройден тест бессмертия.

    Минимальный интеллектуальный Signal-тест

    Теста предполагает упрощенную форму ответов на вопросы — только да и нет.

    Мета-тест Тьюринга

    Тест предполагает, что машина «умеет мыслить», если она может создать что-то, что она сама хочет проверить на разумность.

    Первое прохождение классического теста Тьюринга зафиксировано 6 июня 2014 года чат-ботом «Женя Густман», разработанным в Санкт-Петербурге. Бот убедил экспертов, что они общаются с 13-летним подростка из Одессы.

    В общем, машины уже способны на многое, сейчас много специалистов работают в данном направлении и нас ждут все более интересные вариации и прохождения данного теста.

    "Eugene Goostman" удалось пройти тест Тьюринга и убедить 33% судей в том, что с ними общается не машина. Программа выдавала себя за триннадцатилетнего мальчика по имени Евгений Густман из Одессы и смогла убедить беседовавших с ней людей в том, что выдаваемые ею ответы принадлежат человеку.

    Тест проходил в Лондонском королевском обществе, его проведение организовал Университет Рединга, Великобритания. Авторами программы являются российский инженер Владимир Веселов, проживающий в настоящее время в США, и украинец Евгений Демченко, который живёт сейчас в России.

    Как программа "Евгений Густман" прошла тест Тьюринга?

    В субботу 7 июня 2014 года суперкомпьютер по имени Eugene попытался воссоздать интеллект тринадцатилетнего подростка - Евгения Густмана.

    В тестировании, организованном Школой системной инженерии при Университете Рединга (Великобритания), участвовали пять суперкомпьютеров. Испытание представляло собой серию пятиминутных письменных диалогов.

    Разработчикам программы удалось подготовить бота ко всем возможным вопросам и даже обучить его собирать примеры диалогов через Twitter. Кроме того, инженеры наделили героя ярким характером. Притворяясь 13-летним мальчиком, виртуальный «Евгений Густман» не вызывал сомнений у экспертов. Они поверили в то, что мальчик может не знать ответы на многие вопросы, ведь уровень знаний у среднего ребёнка существенно ниже, чем у взрослых. При этом его правильные и точные ответы списывали на необычную эрудицию и начитанность.

    В тесте участвовали 25 «скрытых» людей и 5 чат-ботов. Каждый из 30-ти судей провёл по пять чат-сессий, пытаясь определить реальную природу собеседника. Для сравнения, в традиционном ежегодном конкурсе программ искусственного интеллекта на премию Лёбнера* участвует всего 4 программы и 4 скрытых человека.

    Впервые программа с «юным одесситом» появилась ещё в 2001 году. Однако лишь в 2012 году она показала действительно серьёзный результат, убедив 29 % судей.

    Данный факт доказывает, что в скором будущем, появятся програмы, которые будут способны без проблем пройти тест Тьюринга .

    А я вчера завалил тест Тьюринга: меня приняли за компьютер! Дело было при игре в шахматы на freechess.org . Вообще в онлайн-шахматах очень много плакс, которые, чуть что, норовят обвинить оппонента в использовании движка. Конечно, много кто так жульничает, но меня всегда обвиняют беспочвенно. В дебютную библиотеку, бывает, подглядываю, а дальше уже только сам. Если удаётся поймать соперника на длинный вариант, у него почему-то часто от этого лютый баттхёрт приключается: не может, говорит, человек так играть.

    Полностью во вьюере можно посмотреть тут: Karapuzik vs. chessmasterrossie , а самые яркие моменты я сейчас прокомментирую отдельно. Дело в том, что мне самому партия очень понравилась, и хочется похвастаться. Контроль — 5 минут на партию плюс 5 секунд на ход.

    Вот такая позиция возникла после 18 ходов.

    В дебюте белые (я) играли несколько безалаберно, в частности, ферзь проделал путь d1-b3-d1-g1, много времени потеряно. Вообще ферзь на g1 или f2 в этой схеме часто встаёт, но обычно его путь менее извилист. Чёрные из потерь только успели сходить конём b8-c6-e5-d7, а сейчас явно готовятся к b6-b5. Главная проблема, что мой любимый план с надвижением пешки "a" у белых не проходит: мешает собственный конь на a3. Пока его не уберу, активного плана нет. А как только уберу, получу b5... Тут я заметил комбинационный мотив и устроил провокацию: 19.Nc2 b5? 20.Nb4 Qb7 .

    21.N:a6! Q:a6 (полагаю, что 21... b4 было сильнее) 22.c:b5 B:b5 23.N:b5 R:b5 24.a4

    В этом всё дело! Теперь белые забирают целую ладью и остаются по итогам перестрелки с лишним качеством и пешкой. Дальше была довольно сумбурная игра в блиц, под занавес которой соперник опять попался на простую тактику. Это его, похоже, и добило. Тактику же только компьютеры умеют, особенно такую сложную:

    34... B:b4? 35.Rb1 Rb7 (на это была вся надежда, но...) 36.a6! Rb5 37.a7 , и, чтобы остановить пешку, приходится отдать слона b4.

    Тут соперник что-то стал медленно ходить. Смотрю — он мне в чятик пишет. Пишет следующее:

    chessmasterrossie says: good engine usage
    chessmasterrossie says: good engine usagenh5
    chessmasterrossie says: such comput er moves
    chessmasterrossie says: such computer moves
    chessmasterrossie says: qg1???
    chessmasterrossie says: as if a human would play that
    chessmasterrossie says: g4?
    chessmasterrossie says: such a human move!
    chessmasterrossie says: how obviously was that a use of a chess engine.
    chessmasterrossie says: I will send a compulaint
    chessmasterrossie says: complaint

    Просто бальзам на сердце. =)