Patentbesvärsrättens avgöranden


Register över Patentbesvärsrättens mål och avgöranden från 1989 till och med den 31 augusti 2016.
För äldre avgöranden, kontakta Stockholms tingsrätts arkiv.

03-151
2006-05-31
2006-08-01
Patent på "Förfarande och system för taligenkänning".
2003-06-10
-
-
9802990-3
2003-04-11
-
-
-
Uppfinningshöjd
Taligenkänning; Mobiltelefon
2 § patentlagen (1967:837)
patent
avslag
intressant
sökande
Telefonaktiebolaget L M Ericsson
Bergenstråhle & Lindvall AB
-
-
-
-
Ett taligenkänningssystem i en röststyrd mobiltelefon och ett förfarande för taligenkänning i ett taligenkänningssystem i en röststyrd mobiltelefon har ansetts sakna uppfinningshöjd i förhållande till känd teknik. - Taligenkänningssystemet innefattar en vokabulär med ett flertal, i grupper, lagrade ord som bildar en spaljéstruktur, varvid taligenkänningssystemet är utformat att först känna igen ett i vokabulären inmatat första ord och därefter, då ett andra ord inmatas i mobiltelefonen, genomsöka endast en grupp av ord som finns under det första ordet. Taligenkänningssystemet syftar bl.a. till att åstadkomma förbättrad noggrannhet så att taligenkänningssystemet kan användas i en brusig omgivning med ekoeffekter.
-
DOMSLUT

Patentbesvärsrätten bifaller inte överklagandet.

REDOGÖRELSE FÖR SAKEN OCH FRAMSTÄLLT YRKANDE

Telefonaktiebolaget LM Ericsson ansökte den 4 september 1998 om patent på ”A method and a system for speech recognition”. I det överklagade beslutet avslog Patent- och registreringsverket (Patentverket) patentansökningen, med patentkrav inkomna den 4 januari 2000, med motiveringen att uppfinningen inte skiljer sig väsentligen från den i US 5 386 494 A (D1) kända tekniken.

Uppfinningen

Den patentsökta uppfinningen avser ett taligenkänningssytem i en röststyrd mobiltelefon och ett förfarande för taligenkänning i ett taligenkänningssytem i en röststyrd mobiltelefon.

I beskrivningen anges att taligenkänning används för att förenkla gränssnittet mellan människa-maskin, varvid huvudsyftet i taligenkänningssystem är att få en maskin att förstå ett uttalande som görs av en mänsklig talare. Ett problem med kända taligenkänningssystem är att sådana uttalanden kan tolkas fel av taligenkänningssystemet, dels på grund av olika uttal hos talaren och dels på grund av att den i systemet inmatade signalen (i form av ett uttalande) har distorderats till följd av t.ex. närvaro av brus och ekoeffekter. Ett annat problem med kända taligenkänningssystem anges vara att antalet ord, även om det är begränsat till typiskt några hundra, kräver en mycket stor processorkraft. I ett system där realtidskrav finns måste taligenkänningssystemet kunna behandla den stora information som finns i varje ord mycket snabbt.

Ett syfte med föreliggande uppfinning är att övervinna några av de problem som hör samman med teknikens ståndpunkt och att åstadkomma ett förfarande och ett system med förbättrad noggrannhet så att det kan användas i en brusig omgivning med ekoeffekter.

Yrkande

I överklagandet har sökanden yrkat att patentverkets avslagsbeslut upphävs och att de till Patentbesvärsrätten ingivna nya kraven 1-10 godkänns.

Uppfinningen definieras enligt de självständiga kraven 1 och 6 på följande sätt:

1. Ett taligenkänningssystem i en röststyrd mobiltelefon, vilket system innefattar organ för att analysera inmatade talsignaler, en vokabulär med ett flertal lagrade ord, samt organ för att jämföra inmatade ord med ord lagrade i vokabulären, kännetecknad av att orden i vokabulären är anordnade i en spaljéstruktur som innefattar ett antal grupper av ord, varvid taligenkänningssystemet är utformat att först känna igen ett i mobiltelefonen inmatat första ord, och därefter genomsöka endast en grupp av ord i vokabulären som finns under det första ordet, då ett andra ord inmatas i mobiltelefonen.

6. Förfarande för taligenkänning i ett taligenkänningssystem i en röststyrd mobiltelefon, vilket system analyserar inmatade talsignaler och jämför inmatade ord med ord som är lagrade i en vokabulär, kännetecknad av att orden i vokabulären är anordnade i en spaljéstruktur som innefattar ett antal grupper av ord, varvid ett i mobiltelefonen inmatat första ord först känns igen, och därefter endast en grupp av ord genomsöks i vokabulären som finns under det första ordet, då ett andra ord inmatas i mobiltelefonen.

Grund

Som grund för sin talan har sökanden anfört att uppfinningen är ny och skiljer sig väsentligen från det som visats tidigare känt.

Sökandens utveckling av talan

I Patentbesvärsrätten har sökanden anfört i huvudsak följande.

Det anförda dokumentet D1 beskriver en dator med röststyrningsfunktion. Den beskrivna tekniken är avsedd att göra röstkommandon mer effektiva för en användare vid bearbetning av objekt eller liknande på en bildskärm. Både en muspekare och röststyrning används i kombination, så att endast de med pekaren markerade objekten eller avsnitten på datorns bildskärm påverkas av därefter intalade röstkommandon.

Den patentsökta uppfinningen är däremot inriktad på att underlätta en procedur för taligenkänning i en mobiltelefon, dvs. då inmatade ord matchas med ord som är lagrade i en vokabulär i mobiltelefonen. Detta åstadkoms dels genom att orden i vokabulären är anordnade i en spaljéstruktur med grupper av ord, och dels genom att endast genomsöka aktuell grupp av ord. Därmed kan antal ord som genomsöks för matchning begränsas väsentligt.

Vi vill betona att det är ytterst önskvärt att förenkla mekanismen för taligenkänning i röststyrda mobiltelefoner, där processor och minneskapaciteten oftast är mycket begränsad, men ändå uppnå acceptabel precision. En sådan effektiviserad funktionalitet för taligenkänning kan inte på något sätt utläsas i Dl, som överhuvudtaget inte beskriver någon mekanism hos datorn för att känna igen inmatade ord. Däremot anges att användaren genom menyer eller motsvarande erbjuds begränsade valmöjligheter att tala in kommandon, beroende på markering av objekt, vilket är något helt annat. Som kontrast till den patentsökta uppfinningen används i D1 dessutom en dator med förhållandevis stor bildskärm och hög processor och minneskapacitet, varför den patentsökta uppfinningens problem inte alls föreligger.

Den patentsökta uppfinningen erbjuder en förenklad mekanism för automatiserad taligenkänning i mobiltelefoner som möjliggör att endast röststyrning används utan att efordra någon pekare på skärm, och som exempelvis är oberoende av vilken typ av signalanalys som används. Genom användning av en vokabulär med spaljéstruktur och genomsökning av en begränsad ordgrupp i taget effektiviseras taligenkänningen maximalt, vilket ger kort behandlingstid och en säker och robust igenkänning som är relativt okänslig för störningar och kräver ingen hög processor och minneskapacitet i mobiltelefonen. I synnerhet behöver inte en fullständig s.k.Viterbi sökmetod användas för att uppnå acceptabel precision, tack vare utnyttjande av vokabulärens spaljéstruktur med ordgrupper. Denna tämligen komplicerade Viterbi metod används annars ofta i datorer och kräver mycket processorkraft.

DOMSKÄL

Patentbesvärsrätten konstaterar inledningsvis att taligenkänningssystem för röststyrda mobiltelefoner, där ett inmatat ord jämförs med ord i en vokabulär, var allmänt kända innan ifrågavarande ansöknings ingivningsdag. Denna teknik får, för bedömning av uppfinningshöjd, anses utgöra den teknik som kommer den patentsökta uppfinningen närmast.

Taligenkänningssystemet enligt patentkravet 1 skiljer sig från den närmaste tekniken genom att det har en vokabulär vars ord är anordnade i en spaljéstruktur som innefattar ett antal grupper av ord och att systemet är utformat att först känna igen ett första inmatat ord och därefter, vid inmatning av ett andra ord, söka bland ord i den grupp som finns under det första ordet. Därvid kommer vid varje tillfälle endast en del av den totala vokabulären att sökas igenom efter matchande ord, varvid problemet med att behöva genomsöka många ord löses samtidigt som noggrannheten för taligenkänningssystemet ökar.

Fackmannen som ställs inför problemet att förbättra ett taligenkänningssystems snabbhet och noggrannhet finner i D1 en alternativ metod att styra ett taligenkänningssystem, som dock är anordnat i ett datorsystem. Enligt den kända metoden finns för styrning genom taligenkänning dels generella kommandon (ord) och dels kommandon (ord) knutna till vissa objekt. Operatören kan välja att uttala ett generellt kommando eller att först välja ett objekt och därefter uttala ett kommando tillhörigt objektet. Val av objekt kan ske genom att ett "selection command" uttalas medan en markör med hjälp av ett pekdon, t.ex. tangenterna hos ett tangentbord, är positionerad över objektet.

Det framgår inte vad nyssnämnda "selection command" består av för ord eller om det definierar objektet eller ej. Däremot står det klart att taligenkänningssystemet i ett första skede bara behöver söka bland generella kommandon, och att systemet, om ett objekt i stället väljs först, endast behöver söka bland de kommandon som hör till det valda objektet. Därvid kommer antalet möjliga "kommandon" som behöver genomsökas vid varje tillfälle att begränsas. Objekten tillsammans med respektive underordnade grupp av kommandon får härvid anses bilda en trädstruktur. Genom att antalet kommandon som behöver sökas igenom därmed begränsats blir taligenkänningssystemets snabbhet och noggrannhet förbättrad.

Med hänsyn till hur generella kommandon och kommandon knutna till ett objekt väljs i D1 är det enligt Patentbesvärsrättens mening uppenbart för fackmannen att taligenkänningssystemet enkelt kan modifieras så att objekten definieras av unika ord och väljs, med eller utan markör positionerad över aktuellt objekt, genom att uttala ett motsvarande ord (”selection command”).

Det får därtill anses vara uppenbart för fackmannen att taligenkänningssystem för datorer även kan vara lämpliga att använda inom andra områden där röststyrning förekommer, t.ex. mobiltelefoner, och att systemet i D1, genom att antalet kommandon som behöver genomsökas har begränsats, kommer att kräva mindre processorkraft än vad som annars skulle ha varit fallet.

En modifiering av den närmaste tekniken med hänsyn till vad som är känt genom D1 och fackmannens allmänna kunnande leder till ett taligenkänningssystem vars vokabulär innefattar dels generella kommandon (ord) och dels kommandon (ord) grupperade under ett antal objekt. För att utföra ett kommando som tillhör ett objekt väljs i ett första skede detta objekt genom att ett för objektet specifikt ”selection command” (ord) uttalas varefter i ett andra skede systemet söker bland de kommandon (ord) som tillhör objektet när kommandot (ordet) uttalas. Vid varje tillfälle genomsöks således en begränsad del av den totala vokabulären.

Enligt Patentbesvärsrättens mening leder således den kända tekniken fackmannen, som strävar efter att öka taligenkänningssystemets snabbhet och noggrannhet, till ett system som överensstämmer med uppfinningen såsom den definieras i patentkravet 1. Då sökanden ej heller visat att någon oväntad teknisk effekt erhållits med uppfinningen kan den inte anses ha erforderlig uppfinningshöjd.

Samma bedömning gäller förfarandet för taligenkänning enligt patentkravet 6.

Vid angivna förhållanden kan överklagandet inte bifallas.

Per Carlson Anders Brinkman Håkan Sandh

Referent

Enhälligt

ANVISNING FÖR ÖVERKLAGANDE, se bilaga 2 (Formulär A)

EE
Visa mer Visa mindre