Разговор с Google Duplex: Google е подобен на човека Aаз телефон се чувства революционен

„Снимка Увеличи / Краят резултат от Duplex. Поискате резервация, прави телефонно обаждане на заден план и ви се връща с резултат.Google

Ню Йорк – Очевидно не съм ходил на мелница прес събитие. Приблизително два месеца след годишната I / O конференция, Google тази седмица покани Ars и няколко други журналисти на Тайландски ресторант THEP в Ню Йорк. Компанията изкупи ресторант за деня, изчисти масите и построи малко зона за презентация в комплект с телевизор, високоговорител и столове. Следващия до телевизора беше подиум с действителния телефон на ресторанта в Тайланд – не нов фирмен смартфон, ol ‘аналогова линия ресторант.

Всички знаехме в какво влизаме. На I / O 2018, Google шокира света с демонстрация на “Google Duplex”, AI система за изпълнение на реални задачи по телефона. Кратката демонстрация се почувства като кулминацията на различните разпознавания на глас и възможности за синтез на реч: гласовият бот на Google може да извика бизнеса и да си уговорите среща от ваше име през цялото време звучи шокиращо подобно – някои биха казали измамно подобно – на а човек. Нейната демонстрация дори завърши с изкуствена реч несъответствия като “хм” и “ъъъ”.

Кратката, предварително записана входно-изходна витрина скоро тръгна от войнствена буря дебат в мрежата. Хората поставят под въпрос етиката на ИИ, че претендирани за човешки, законите за подслушване са поставени под въпрос и някои дори подлагат на съмнение дали демото е фалшифицирано. Различно от обещаващо Duplex щеше да се обяви за робот в бъдеще, което Google имаше бяха доста тихи относно проекта след събитието.

Тогава Google изведнъж каза, че е готова да говори повече за Дуплекс. Още по-добре, компанията би ме оставила да говоря директно със скандалния AI. Така поне за един следобед не бях Рон Amadeo, Ars Technica Редактор на отзиви – Бях Рон Амадео, THEP служител на ресторанта, който чака да се обади на телефонни разговори от ” бот.

Eventually, the Duplex flow will work something like this. За  today, the Google Assistant voice command system didn't work. Starting Duplex happened via a laptop.Увеличи / В крайна сметка, дуплексният поток ще работи нещо подобно. Forднес системата за гласова команда на Google Assistant не работи. Стартирането на Duplex се случи чрез лаптоп.Google

Разговор с Google Duplex

За съжаление Google не би ни позволил да записваме на живо взаимодействия тази седмица, но това даде видео, което сме вградили По-долу. Робо обаждането във видеото е, честно казано, перфектно представител на това, което преживяхме. Но да закача някои от скептицизъм, нека първо да очертаем спецификите на това демо беше създаден заедно с това, което работи и какво не.

По ирония на съдбата, единственото нещо, което не работеше в нашата демонстрация, беше единственото нещо, което всеки може да опита днес: Google Assistant. В потребител Duplex взаимодействие, потребителят би казал нещо подобно „OK Google, резервирайте маса за четирима в ресторант THE Thai в 18:00. “Оттам Google Асистентът ще изстреля Duplex и обадете се. Но в нашата демонстрация разговорът никога не е иницииран с a словесна гласова команда. Вместо това, инженер в ъгъла на стая безшумно пробива изисквания за резервация в компютъра му, и Duplex след това пое и се обади на бизнеса.

(За щастие, гласовото активиране изглежда като най-малко важно част от Google Duplex. Знаем, че Google Assistant работи. Ние знаем може да се справи с гласови команди. Знаем, че може да започне повикване с a назован бизнес с помощта на информация от Google Карти.)

Телефонът на ресторанта THEP се оказа наистина истински, на живо телефонна линия. Посредством демонстрации в един момент, телефонът неочаквано започна да звъни. Google представителят бързо засне „Чакай, започна ли обаждане? “, въпрос към инженера в ъгъла. След като каза не, Собственикът на THEP набързо се затича към телефона, за да говори с a истински клиент.

По време на демонстрационния период нещата вървяха много повече според това планирам. В хода на събитието чухме няколко обаждания, започнете да завършвате, боравейки се с жива телефонна система. За начало: a Google представител обиколи стаята и взе изисквания за резервация от групата, неща като „Колко време трябва да бъде резервацията за? “или” Колко души? “Нашите изисквания бяха пробити в компютър и телефонът скоро иззвъня. Журналисти – грешка, ресторант служители – биха могли да диктуват посоката на разговора, колкото и да е така избирам. Някои влагат усилия да объркат Duplex и да го хвърлят curveballs, но това AIworked безотказно в самата ограничен обхват на резервация в ресторант.

Трябва да запазя ежедневната си работа

В моята група взех първия телефонен разговор от Google Duplex. Iотиде до предната част на презентационната зона, вдигна звънещ приемник и разговорът започна от телефона и над високоговорител. Слушането на записи на Duplex е едно, но, но участие в разговор с телефонния бот на Google (пред живо публика, не по-малко) е съвсем различно изживяване. Веднага, Разбрах, че това е много повече, отколкото очаквах: Google PR, Инженери от Google, служители на ресторанта и няколко други журналисти внимателно гледаха и ме слушаха да приемам този разговор говорител. Бях нервен. Никога не съм вземал ресторант резервация в живота ми, камо ли такава с аудитория и ан инженеринг екипаж мониторинг на всяко изказване.И знаете ли Какво? Сукнах, като взех тази резервация. И Дуплекс беше добре с него.

Дуплекс търпеливо изчака да ме препънат неловко първата резервация на маса в момента, докато небрежно си записах времето и се претърпяха през основни теми за Google резервация за четирима души в 19:00 в четвъртък. Днес Google Асистентът изисква авторитетна, директна, съвършена реч в ред за обработка на команда. Но Duplex се справи с тромавата ми разсеяна общуване с случайната незаинтересованост на истински човек. То изчаках да напиша неговите изисквания за резервация и кога Помолих Duplex да повтори неща, които не съм хванал за първи път („A резервация по кое време? “), това стана без инциденти. Кога аз каза на този robocaller, че първоначалното време, което искаше, не е налице, тя започна време за преговори; тя предлага приемлив времеви диапазон и поиска резервация някъде в това време. аз предложих седем часа и Google прие.

От човешки край гласът на Дуплекс е абсолютно зашеметяващ телефонът. Звучи реално през повечето време, приковавайки по-голямата част от протезодичните особености на човешката реч по време на нормалното говорене. Ботът “ums” и “uhs”, когато трябва да си припомни нещо, за което човек може би трябва да помисли за минута. То дайте потвърждение “mmhmms”, ако му кажете да се задържи за минута. Всичко протича гладко, което прави звук като нещо поколение по-добро от настоящия глас на Google Assistant.

Една от най-странните (и най-впечатляващите) части на Duplex е че няма нито един “дуплекс глас”. За всяко обаждане, Duplex би поставил нова, ясно изразена личност. Понякога идват Duplex напречно като мъжки; понякога женски. Някои гласове бяха по-високи и по-младо звучене; някои бяха назално, а някои дори звучаха сладък.

Толкова впечатляващо, колкото и да чувате компютър реалистично копирайте човешката реч, моделът, който генерира тези гласове, WaveNet (от подразделението на Deepmind на Google) всъщност се задържа в отдела за човешка мимикрия. Блогът на Deepmind вече има разкри, че WaveNet може да генерира човешки звуци в устата, ако иска да се. В блога има демонстрации за това как диша и прави устни шум шум между изречения. Duplex не прави нищо от това още.

По време на I / O основната бележка, Google пуска кратък, предварително записан Двустранен разговор. Като се има предвид, че на записа липсваха много от важни парчета от нормален бизнес разговор, мнозина подозираха, че демонстрацията беше силно редактирана. Служителите никога не са казвали бизнеса ” име и Google никога не е издавал важна идентифицираща информация като телефонен номер. Хората също взеха проблем с липсата на разкриване, че Duplex е робот и липсата на a разкриването на запис на повиквания би било нарушение на закона в много от тях състояния. Мисля, че най-простото обяснение за I / O демонстрацията е това Обаждането на Google беше редактирано за поверителност и краткост и беше само означаваше като закачка. По наше време в THEP Thai, всичко това бяха разгледани опасенията.

Всяко едно обаждане започваше с нещо по линия на, “Здравей, призовавам да направя резервация. Автоматизиран съм от Google услуга за резервации, така че ще запиша обаждането. Мога ли да резервирам резервация за … “Това обхвана както разкритието” Аз съм робот “, така и тревогите „този разговор се записва“, повдигнати по-рано. Google казва, че все още работи върху точните съобщения, но компания винаги е имала намерение да разкрие, че става въпрос за запис на роботи повикването.

Duplex е добре да предоставя информация, но е създаден само да дава информация, която ботът има право да споделя. В днешното демонстрация, Duplex ясно, бавно ще посочи демото на обаждащия се телефонен номер или име, когато бъдете попитани. Дори имаше добър телефонен етикет, казвайки неща като „Името е Рон, това е R, O, N.“ В едно точка, имейлът на обаждащите се е поискал и Duplex отговори с „Страхувам се, че нямам разрешение да споделям клиентските си електронна поща.”

Това изписване на имена и числа е еднократният Duplex наистина губи илюзията да звучи човешко. Това е почти като WaveNet изобщо не практикува тази част от речта и услугата изпада в режим Speak & Spell, когато трябва да се размине отделни герои. Интонацията на всяка буква или цифра е навсякъде, никога не протичащи с нормално начало и край тонове, които човек би използвал.

Поглеждайки назад, аз също се занимавам с някои от “личностите” Дуплекс представен. Google Assistant се представя като щастлив, професионален робот асистент с малко забавна серия. То може разкажете случайна шега, но Асистентът обикновено говори с правилен език, добро изговаряне и щастливо, възпитано отношение. в контраст, Duplex е много по-небрежен. Google основно изгради секретар AI с Duplex, но това не говори с практикуваните увереност на някой, свикнал да прави резерви – често звучи като ateenager да поръча пица. Това не е задължително как бих искал да бъда представен в бизнес. Най- непринуденото отношение понякога може да се комбинира с случайното интонационен бъг и се натъквам на раздразнен, уморен, незаинтересован, или саркастичен.

Like this post? Please share to your friends:
Leave a Reply

;-) :| :x :twisted: :smile: :shock: :sad: :roll: :razz: :oops: :o :mrgreen: :lol: :idea: :grin: :evil: :cry: :cool: :arrow: :???: :?: :!: