Інтернет з кожним днем все більше нагадує самоорганізований універсум, що еволюціонує з шаленою швидкістю. І хоча ця система ще не має повноцінного штучного інтелекту, зачатки його створення вже починають з'являтися (наприклад, віртуальний співрозмовник інф або Акінатор, який читає думки, машинний зір та голосовий інтерфейс пошукових систем). Настане той день, коли тест Тьюринга буде пройдено та Інтернет з функціонального інструменту перетвориться на незамінного помічника, а для когось і друга.
Хто стоїть за всім цим? Безумовно, це спільноти людей. Співтовариства, що об'єднані спільними ідеями, цілями та інтересами, які готові витрачати свій час і ресурси на втілення цих ідей. Тому, з кожним днем в Інтернеті з'являється все більше розумних програм, їх функціонал стає все ширше, а відвідувачі перетворюються зі споживачів в активних творців контенту.
Віртуальний співрозмовник (бот-консультант) - це фахівець технічної підтримки, який є доступним цілодобово і миттєво відповідає на запитання користувачів. Він спілкується на природній мові. Він може не тільки допомогти щось знайти на сайті, а й запропонувати корисну для користувача інформацію або товар. Бот зберігає задані йому запитання. Завдяки цьому власник сайту може дізнатися, що шукають на сайті, чого бракує, що можна покращити, яка аудиторія клієнтів.
Бот є вбудованим модулем. Щоб відобразити модуль бота потрібно вставити короткий спеціальний код на необхідні сторінки сайту. Консультант може мати стандартне оформлення. Але він також може бути оформлений як індивідуальний персонаж для конкретного сайту.
Бота потрібно навчити відповідати на питання відвідувачів. Початкове навчання робиться на підставі початкового словника. Надалі, аналізуючи діалоги клієнтів і бота, власник сайту може продовжити навчання самостійно.
Всі кроки з налаштування бота, розміщення його бази знань, збору діалогів тощо, компанія розробник робить самостійно. У разі будь-яких питань або необхідних доробок – компанія-розробник підтримує роботу Бота-консультанта.
«Наносемантіка» - лідер російського ринку технологій штучного інтелекту, націлених на вирішення бізнес-завдань. Компанія з 2005 року займається розробкою Інфів - віртуальних співрозмовників, керованих штучним інтелектом. «Наносемантіка» розвиває технології та онлайн-сервіси, в основі яких лежить прямий діалог машини з користувачем.
http://chatbot.tw1.ru/business.htm
Консультант, який здатний працювати 24 години на добу 7 днів на тиждень без відпочинку і перерв на обід - мрія для сервісних компаній з великою кількістю клієнтів, які задають однакові питання.
Першопрохідцем була невелика канадська компанія Tineye, другою - Google, а третьою - китайський пошуковик Baidoo. Яндекс став четвертим гравцем і сподівається, що за ними підтягнеться Microsoft. Втім, в Tineye дуже невелика база картинок (3,5 млрд), а в Baidoo сильний перекіс в китайський ринок. Для українського користувача доречним буде використання пошуку в Яндексі та Google: їх база зображень складає десятки мільярдів зображень.
Сервіс для пошуку зображень використовують алгоритми аналізу і класифікації даних, а для пошуку зображень за візуальним змістом застосовуються технології комп'ютерного зору та опису змісту зображень. Дана технологія перетворює завантажену картинку в набір «візуальних слів». Після цього система серед мільярдів картинок, які містяться в її базі даних вибирає зображення, які мають схожі «візуальні слова» і видає їх користувачеві. При цьому пошук займе не більше хвилини.
Александр Крайнов, менеджер проектов компьютерного зрения
Розробники Яндексу розробили власний алгоритм, який сильно відрізняється від аналогів. Використана Яндексом технологія комп'ютерного зору називається Content Based Image Retrieval (CBIR) і всередині компанії носить назву «Сибір».
Спираючись на узагальнені межі об'єктів, контрастні області та інші ключові елементи картинки, робот створює свою бібліотеку зображень, подібно як звичайний пошуковик викачує спрощені текстові версії веб-сторінок при індексуванні, і вже по ній веде пошук. Здатність до узагальнення вже показує пошук: іноді знаходиться не просто така ж картинка, а інше зображення, що містить такий же об'єкт.
Цей алгоритм найкраще працює з URL-адресою картинки, а не завантаженої з комп'ютера. Тобто, коли вихідна картинка розміщена в Інтернеті, а не на комп'ютері користувача. Оскільки пошукова база обрисів предметів формується з зображень, які вже проіндексовані системою, тому, якщо зображення відсутнє в пошуковій базі, хорошого результату не буде.
На відміну від сервісу Google, який розрізняє кольори, новий алгоритм Яндексу не розрізняє кольори, але здатний аналізувати обриси предметів. Після проведеного аналізу формується пошуковий запит для стандартного (словесного) пошуку за зображеннями. Виняток становлять торгові марки і шрифти - популярні логотипи, зазвичай, програма розпізнає. Те ж саме відноситься і до пам'ятників і архітектурних зображень. Тому, пошук архітектурної пам'ятки за завантаженою картинкою (фотографією) буде успішніше, ніж пошук за фотографією домашнього свята.
Варто відзначити, що пошук за картинками від Google теж часто працює некоректно - в результатах часто демонструються різні зображення зі схожою колірною гамою. Втім, зрозуміло, що даний напрямок тільки починає розвиватися. Яндекс пішов власним шляхом, не відстаючи при цьому від інших конкурентів. Подальші розробки Яндекс просуваються в тому ж напрямку, що і Google, що впровадив технологію Goggles в мобільний пошук. Google Goggles дозволяють шукати в реальному часі за зображенням, що береться з камери смартфону.
Завдяки Голосовому інтерфейсу можна диктувати запити в клієнтській програмі на пристрої, а не вводити їх. Щоб транскрибувати продиктовані слова в написаний текст, Google надсилає вислови на сервери, де використовується технологія розпізнавання шаблонів.
Для того, навчити систему краще розпізнавати правильні пошукові запити, Google зберігає вислови, щоб покращувати служби, зокрема: дані про мову, країну, вислів і припущення системи про сказане. Збережені аудіодані не містять ідентифікатор облікового запису Google, якщо користувач цього не вказав.
Для кожної мови Голосовий інтерфейс Google збирає голосові фрагменти, які дозволяють створити моделі мови, що забезпечують коректну роботу сервісів. Google має базу аудіо образів, що промовляються носіями мови, що відрізняються акцентами, віком і індивідуальними особливостями, вимовляти часто вживані фрази в різних акустичних умовах, наприклад, в ресторані, на вулиці або в машині. Для кожної мови Google створює словник, що містить більше мільйона розпізнаних слів.
Сервіс функціонує на основі системи Speech Input API, завдяки якій і реалізується голосове управління Інтернет-браузером. Сервіс на даний момент втілено в Google Пошук, Google Перекладач, Cmail, Google Docs.
Voice Search - це розширення для Google Chrome, що дозволяє здійснювати пошук або інші дії в Інтернеті за допомогою свого голосу. На сторінці Google в рядку пошуку зображено іконку мікрофону. Користувач має натиснути на нього і вимовити голосно і чітко фразу або слово. Для отримання озвучених відповідей потрібно використовувати мову відповідно до мовного інтерфейсу Google Chrome.
У разі запиту про помітні чи загально визнані об'єкти буде озвучено інформацію, яка береться з «Графа знань» Google - бази, яка містить інформацію про різні об'єкти, події та їхні зв'язки між собою. Відомості з «графа знань» зазвичай виводиться праворуч від результатів пошуку і надає інформацію за запитом, який ввів користувач.
Це може бути, наприклад, інформація про актора, включаючи фільми, в яких він знявся, і дату народження. Озвученню буде підлягати, наприклад, відповідь на прості запитання «Скільки доларів буде в 100 гривнях», «як називається столиця Франції», «хто такий Мануель Баррозу»
Пошукова система Google пропонує голосовий калькулятор Google, який дозволяє за допомогою пристроїв голосового введення миттєво отримувати відповідь на будь-які, навіть найскладніші розрахунки.
Для запуску калькулятора потрібно відкрити Google Chrome і запустити google.com, краще з відкритим акаунтом. Включаєте пристрій голосового введення на комп'ютері і чітко і виразно мовою інтерфейсу Chrome вимовляєте арифметичну дію. У пошуковому рядку з'явиться калькулятор, на якому буде відображено дія і озвучено результат обчислень.
З калькулятором можна взаємодіяти вручну, мишкою або на цифровій клавіатурі набираючи числа і змінні. В голосовому калькуляторі Google передбачено 15 алгебраїчних операцій, з дужками, відсотками, числом пі і е та іншими змінними.
Google почав роботи над універсальним перекладачем принципово нового типу. Ідея нового проекту полягає у створенні сервісу, який дозволить користувачам, що спілкуються на різних мовах, говорити один з одним в режимі реального часу, причому саме «говорити», а не «листуватися». Іншими словами перекладач повинен розпізнати мову, перекласти отриманий в результаті цього текст і відтворити його іншою мовою.
Google Translate цілком успішно переводить тексти на 52 різні мови. Доопрацювання вже існуючих технологій до необхідного рівня займе ще кілька років. Для перекладу певної фрази достатньо натиснути на зображення мікрофона в програмі, сказати в мікрофон потрібні слова і програма автоматично відправить записану мову на сервери Google, де відбудеться розбір звукового файлу і переклад фрази. Після текстового перекладу можна прослухати вимову перекладу і оригінального тексту (синтезований жіночий голос).
Google попереджає, що поки що функція носить експериментальний характер, і не слід чекати від неї 100% правильної роботи. Правильному перекладу можуть перешкодити такі фактори як акцент, чіткість вимови і сторонні шуми.
Для хмарних сервісів Google застосовано кілька способів введення тексту. Поєднання редакторів IME чи інструмента транслітерації, віртуальних клавіатур і рукописного введення дозволяє підтримувати понад 90 мов.
Компанія Google додала до популярних сервісів функцію розпізнавання рукописного тексту. Наприклад, в Google Translate з'явилося спеціальне поле, що підтримує рукописне введення даних. Приміром там можна намалювати ієрогліф і моментально дізнатися його точно позначення. Нова можливість стане в нагоді європейцям і американцям, що вивчають азіатські мови (проект концентрується саме на мовах азіатських груп) і не знають їх хитромудру писемність. На сьогодні існує можливість розпізнавання текстів українською мовою
Для введення тексту можна використовувати мишку або тачпад, де є нормальна підтримка рукописного введення тексту. Для початку роботи з рукописним введенням слід включити відповідну функцію в Gmail. В Google Docs досить буде використовувати комбінацію Ctrl + Shift+K.
Новинку Google будуть поетапно включати для різних регіонів, тому, така функція може бути й відсутня в користувача. Для тих, хто друкує швидше, ніж пише, подібна функція буде непотрібною. Для користувачів, які друкують мовами, символів у якій більше, ніж містить стандартна клавіатура, нововведення може виявитися корисним.
https://support.google.com/plus/answer/2370300?hl=uk
Google впритул зайнялася технологією розпізнавання осіб на фото. Для того, щоб прискорити даний процес, корпорація купила компанію PittPatt, яка займається розробкою відповідних технологій. PittPatt займається не тільки розпізнаванням осіб на фотографіях, але і розпізнаванням фотографій взагалі, з подальшою розміткою (тегуванням) розпізнаних об'єктів.
Результати розробок впроваджуються в різні програми та сервіси компанії, як звичайні, так і мобільні. Технологія інтегрується в фото- і відеододатки Picasa , Goggles , YouTube і Google+.