Включение ПК голосом!

Автор Digital, 29-11-2011, 17:54:57

« предыдущая - следующая »

0 Пользователей и 1 гость просматривают эту тему.

Digital

© overclockers.ru

MSI предлагает избавиться от кнопки "Power"

Оверклокеры с многолетним стажем ещё помнят те времена, когда на лицевой панели системного блока рядом с привычными кнопками "Power" и "Reset" соседствовал переключатель "Turbo". Прогресс не стоит на месте, и клавиша "Turbo", вместе с идеей доступного разгона по одному нажатию клавиши, покинула системный блок. Сегодня компания MSI предлагает заодно избавиться от кнопки "Power".

Как рассказывают наши коллеги с сайта Bright Side Of News, на мероприятии IDF 2011 компания MSI представила небольшую карту расширения для интерфейса PCI Express x1, которая получила название Voice Genie и, помимо непосредственной установки в подходящий слот, подключается к "таинственному" коннектору на материнской плате. По словам Раджива Котари (Rajiv Kotari) и Алекса Чана (Alex Chang), разработчиков технологии, MSI работает над голосовым управлением для материнских плат уже достаточно долгое время, и "таинственный" разъём, к которому необходимо подключать карту расширения, присутствует практически на каждой плате, выпущенной для процессоров в исполнении LGA 1155. Маркировка разъёма - JDLED3 - не позволяла простым пользователям и даже сотрудникам MSI, не причастным к разработке Voice Genie, догадаться о его назначении.


Аппаратная составляющая Voice Genie дополнена специальным программным обеспечением, которое поможет проанализировать голос пользователя и настроить команды для управления. На примере материнской платы MSI Big Bang, для включения компьютера будет достаточно произнести "MSI Big Bang Power On", соответственно, отключить систему можно командой "Power Off MSI Big Bang". Также Voice Genie может быть настроен для выполнения других функций, например, по команде открывать браузер, панель управления, запускать приложения и прочего. Для тех, кому предложенный "язык" общения с компьютером не по душе, предусмотрена возможность самостоятельного задания команд.

MSI пока не спешит называть сроки появления Voice Genie, но говорит о "доступной цене".

Sasha

Думал писать диплом по голосовому управлению ПК когда-то. Но проблема была в том что если реализовывать только программной частью, то как ты его включишь)
А вобще классная идея, у меня сейчас комп ооочень долго включается, а винду пока некогда переустанавливать. А там продрал глаза, крикнул ему, а сам дальше себе вместе с ним расчехляйся на кровати.
skype: ab.sasha

Catcatcat

Все эти приблуды подразумевают нахождение компа в дежурном режиме. В  принципе сейчас в любом биосе (если не жаль держать бесперебойник включённым) есть таймер включения, настраиваешь включение и в нужное время, он будет включаться.

Sasha

Не обязательно, я ж говорю как я понимаю это будет не софтварное, а хардварное решение. MSI же именно такая контора. Вставять в системник плату, как когда-то модно было в люстры чтоб по хлопку включались, и она по определенному звуку будет замыкать контакты.
skype: ab.sasha

Digital

30-11-2011, 07:10:40 #4 Последнее редактирование: 30-11-2011, 07:18:09 от Digital
А что мешает изучить анатомию самой простой нокии с голосовым управлением. По возможности отделить схему а зарядку запитать от дежурки БП. И вместо набора номера импульс пустить на вибро. Только вместо вибры подключить PWR. Микро вывеси к монитору. Проблема - написать программу распознавания речи. Ибо включать, к примеру, шифром "135089" - как-то не комильфо  ::)

Цитата: Catcatcat от 29-11-2011, 18:56:56
Все эти приблуды подразумевают нахождение компа в дежурном режиме. В  принципе сейчас в любом биосе (если не жаль держать бесперебойник включённым) есть таймер включения, настраиваешь включение и в нужное время, он будет включаться.
Если подходить к этому с полным серъёзом - вместо PWR подключить к реле, а его к ИПБ, саму PWR закоротить. Получится, что голосовой командой можно включить/за'стенбай'ить все устройства, подключенные к ИПБ.

Вообще, заморачиваться по этому поводу хочется не из-за псевдо удобства, ибо реально проще, легче и быстрее нажать на кнопу. Хочется технику поставить хоть и только визуально на более высокий уровень, чем просто "кусок металла"...

Catcatcat

ЦитироватьПроблема - написать программу распознавания речи.
;D
Micosoft для виндов 10 лет работает, и до сих пор продолжает усовершенствовать (я на ХР запускал управление речью, но только по английски - открыть, закрыть браузер, работало прилично, даже с мои оксфордским акцентом), алгоритмы для английского, для русского уже не канают. Одно и то же слово сказанной разными людьми (даже если для анализа в лоб, использовать Фурье) получаются разные значения.

То, что используется в телефонах, это не распознавание, это ближе к варианту, когда записывается матрица слова  или команды, а потом идет сравнение с определенными допусками. И часто если кодируются команды в одном помещении, то на улице или в другом помещении уже напряженка в общении телефоном.

Sasha

Распознавание речи я правда не пробовал писать, но там проблем не должно быть. В .net есть открытые библиотки, которые на сколько я слышал норм распознают. Ну а если уж все делать самому, то там математика мне не подвласная. Я уже правда толком ничего и не помню из этой дисциплины, на 3 курсе кажись аж было.
skype: ab.sasha

Proydoha

Помню был маленький, ходил в школу, играл в Deus Ex, в первую часть. И каким-то образом, уже не помню каким, на мой компьютер попала программа голосового управления: записываешь десяток раз команду, вешаешь на неё нажатие какой-нибудь клавиши, включаешь и получаешь все бонусы голосового управления.

Подозреваю, что зрелище было адовым: сидишь и орешь ему в микрофон на разные голоса "Арбалет! Ар-р-р-рбалет! Арбале-е-ет! АРБАЛЕТ! Ар-р-рбале-е-ет! За-айцы! За-а-айцы! ЗАЙЦЫ!"

Если команд заголовлено около десятка, то эффект от любого произнесённого слова был вообще непредсказуемый, что добавляло веселья, особенно, если чудо-программа демонстрировалась друганам.

Sasha

главное нецензурную лексику на команды не вешать , а то потом можно случаянно какуюто команду вызвать)
skype: ab.sasha

Digital

Цитата: Catcatcat от 30-11-2011, 08:22:19
Micosoft для виндов 10 лет работает, и до сих пор продолжает усовершенствовать (я на ХР запускал управление речью, но только по английски - открыть, закрыть браузер, работало прилично, даже с мои оксфордским акцентом), алгоритмы для английского, для русского уже не канают. Одно и то же слово сказанной разными людьми (даже если для анализа в лоб, использовать Фурье) получаются разные значения.

То, что используется в телефонах, это не распознавание, это ближе к варианту, когда записывается матрица слова  или команды, а потом идет сравнение с определенными допусками. И часто если кодируются команды в одном помещении, то на улице или в другом помещении уже напряженка в общении телефоном.
Ну дык, разговора об интеллектуальном распознавании команд нет и не было. Ога, еще комментарии компьютера и его тонкой души к проигранной композиции Моцарта или Себастьяна Баха  ;D
Всё сводится как раз к "записываемой матрице-примере", к большему прогресс ещё не дошел, увы... (или дошел, но от нас еще этот факт старательно скрывают американские спецагенты)
Главная задача - скрестить телефон и мать (голос.вкл/выкл).

[spoiler]Касательно управления ПК есть очень забавные программки, но, увы еще оооочень сырые. Есть французская программа-менеджер:
Запускается с виндой (онли ХР. у меня на семерке она была имбецилом))  :o)
Там окошко, фейс анимешки, типа можно смотреть на то, какие "эмоции испытывает" программа.
Но самое интересное, что:
1. программа интеллектуально самообучаема. Помнит весь разговор за всё время, а не только предыдущие месседжы.
2. программа отслеживает потребности человека. Т.е. назвал имя, она спросила, кто этот человек, ты говоришь кто он, телефон, мыло и т.д. А потом можно попросить отправить письмо или позмонить нужному человеку. Или дать команду на выключение ПК через определенное время, поиск файла на нескольких поисковиках и прочее, проче...
Но переведена на инглиш гуглём, поэтому весь кайф потерян... Но потенциал у этой программки очень большой.[/spoiler]

Sasha

Цитата: Digital от 01-12-2011, 08:04:31
Цитата: Catcatcat от 30-11-2011, 08:22:19
Micosoft для виндов 10 лет работает, и до сих пор продолжает усовершенствовать (я на ХР запускал управление речью, но только по английски - открыть, закрыть браузер, работало прилично, даже с мои оксфордским акцентом), алгоритмы для английского, для русского уже не канают. Одно и то же слово сказанной разными людьми (даже если для анализа в лоб, использовать Фурье) получаются разные значения.

То, что используется в телефонах, это не распознавание, это ближе к варианту, когда записывается матрица слова  или команды, а потом идет сравнение с определенными допусками. И часто если кодируются команды в одном помещении, то на улице или в другом помещении уже напряженка в общении телефоном.
Ну дык, разговора об интеллектуальном распознавании команд нет и не было. Ога, еще комментарии компьютера и его тонкой души к проигранной композиции Моцарта или Себастьяна Баха  ;D
Всё сводится как раз к "записываемой матрице-примере", к большему прогресс ещё не дошел, увы... (или дошел, но от нас еще этот факт старательно скрывают американские спецагенты)
Главная задача - скрестить телефон и мать (голос.вкл/выкл).

Извини но на счет наличия распознавания только на уровне сопоставление с образцом то это полный бред. Ну или конечно смотря что подразумевается. Мы то тоже речь распознаем сопоставляя с образцами которые помнит наша голова. Так что или разъясни что ты подразумеваешь под интеллектуальностью или ты извини написал кхм... неправду.
skype: ab.sasha

Digital

06-12-2011, 10:20:33 #11 Последнее редактирование: 06-12-2011, 18:50:43 от Sasha
Сопоставление это сопоставление. Образец добавляется либо на "зачаточном" этапе написания программы в виде кода, либо болванка - набор звуков в соответствующем формате. Программа сравнивает input с образцом.
Саша, а что в твоем понимании "интеллектуально"?

Sasha

Цитата: Digital от 06-12-2011, 10:20:33
Сопоставление это сопоставление. Образец добавляется либо на "зачаточном" этапе написания программы в виде кода, либо болванка - набор звуков в соответствующем формате. Программа сравнивает input с образцом.
Саша, а что в твоем понимании "интеллектуально"?
Это я как раз у тебя спросил) Что ты имеешь в виду под остутствием интеллектуальности)
Может я конечно чего-то не знаю что знаешь ты, но опять то что ты написал кажется мне бредом. Никто так не делает и ниче такой подход у тебя не распознает. А если ты мне докажешь что я не прав, то можешь кинуть в меня камень.
skype: ab.sasha

Sasha

Блин, вечно вместо цитировать нажимаю редактировать)
skype: ab.sasha

Digital

Цитата: Sasha от 06-12-2011, 18:50:49
Цитата: Digital от 06-12-2011, 10:20:33
Сопоставление это сопоставление. Образец добавляется либо на "зачаточном" этапе написания программы в виде кода, либо болванка - набор звуков в соответствующем формате. Программа сравнивает input с образцом.
Саша, а что в твоем понимании "интеллектуально"?
Это я как раз у тебя спросил) Что ты имеешь в виду под остутствием интеллектуальности)
Может я конечно чего-то не знаю что знаешь ты, но опять то что ты написал кажется мне бредом. Никто так не делает и ниче такой подход у тебя не распознает. А если ты мне докажешь что я не прав, то можешь кинуть в меня камень.
Если коротко - AI должен уметь анализировать входящую и хранящуюся информации, интонацию, мимику и прочее, что для хумана обыденность, без какой-либо предваритеьной подготовки. Т.е. если что-то не понимает/знает сам должен додуматься спросить и запомнить.

Есть роботы-собеседники. Они построены по банальному принципу, которому скоро уже лет 40. Есть база данных. В ней предложения, слова и символы. Когда ты пишешь ему что-то - он анализирует БД и подбирает подходящее предложение. Для более живого общения, предложений ответа может быть несколько, которые рендомно выбираются. Сейчас уже продвинулось немного вперед, и БД самообновляется сообщениями тех, кто общается с роботом. Можно общаться голосом и слушать ответы. Но ни о какой интонации речи быть не может. Это не AI, а его симуляция.

Так вот, в этой теме я как раз и акцентирую внимание на симуляции AI. Записать команду с определенной интонацией, дать определенный допуск тональности, после чего система будет сопоставлять входящий wav с тем, что в "базе данных". else input = bd "power on" else input≠bd "вернуться к началу".

Саша с твоими знаниями, я с тобой спорить не имею морального права. Просто говорю свои (пусть и возможно неправильные) мысли.