Ciò è seguito alla mia posta del blog a partire dalla settimana scorsa intitolata ha googlato l'elasticità Lionbridge lo stivale? ed altri pensieri sull'affare di IBM-LIOX. Sembra che alcune delle osservazioni formulate da Kirti Vashi, dalle tau e da me stesso abbiano avviato alcune reazioni da Lionbridge e da IBM (che Kirti si è riferito a come controllo dei danni del `'). dovuto le dimensioni delle osservazioni e degli articoli che sono stati pubblicati nell'ultima settimana, ho pensato che fosse buona idea dedicare un nuovo post del blog di GTS per ulteriore discussione.

Visione o realtà?

La domanda principale che è venuto alla mia mente: è l'annuncio di IBM/Lionbridge una visione o un annuncio del conglomerato per la produzione di cemento? Possono i clienti di Lionbridge usare oggi questa nuova tecnologia emozionante? O devono aspettare finché la visione non si trasformi in in una realtà sotto forma di prodotto reale? Non sono sicuro della risposta ma da cui posso dire, l'annuncio drammatico non è qualcosa che chiunque possa affondare i loro denti in. eppure.

Chi è György Smidt?

Uno dei commentatori sulla mia posta precedente del blog era ` György Smidt.' Ho cercato questa persona sui motori di ricerca e sulle grandi reti sociali e non ho trovato chiunque con questo nome nell'industria della localizzazione. Posso supporre soltanto che il ` György Smidt' è uno pseudonimo per qualcuno che lavori ad IBM o a Lionbridge. Forse sono sbagliato e se il sig. Smidt farà una certa luce sulla sua identità poi ritirerò subito questo.

RbMT o SMT? Quali lingue sono sostenute?

Chiaramente, IBM RTTS è SMT e non RbMT. Ciò è stata dichiarata in una posta del blog da Lionbridge. Ma Lionbridge non ha annunciato quali lingue saranno sostenute. IBM RTTS sostiene ufficialmente soltanto alcune lingue (inglese, arabo, semplificato ed il cinese tradizionale, il francese, il tedesco, l'italiano, il giapponese, il Coreano, Portoghese, russo e spagnolo, vede www.research.ibm.com/social/projects_nfluent.html). Google, Microsoft, tessitore di lingua e perfino Systran Support Molte altre lingue.  Così perché IBM non sostiene più lingue? Particolarmente se è SMT che fa l'aggiunta delle lingue molto più velocemente. (O poichè avevo suggerito in mio post precedente del blog, forse IBM usa un sistema dell'ibrido SMT/RbMT che ancora conta molto sulle regole di lingua, rendenti allo srotolamento delle lingue un processo lento).

Il sig. Smidt ha formulato la seguente osservazione su questa:

Sull'argomento delle lingue di sostegno: Perché dovreste essere sorpreso alla sovrapposizione fra le lingue? Quelle sono tutte le lingue della cima-fila per IBM in termini di reddito globale ed i mercati o bisogni interni del personale. Riguardo a perché ci non sono più lingue: sì, è (molto) più facile da aggiungere una coppia linguistica di SMT che e di RbMT le paia, ma voi necessità abbastanza dati di seminare una coppia linguistica di SMT ed in modo da pensereste vedere le coppie di lingue di SMT in quelle zone dove IBM ha dati significativi del TM in atto. Non potrebbero appena pop-up, per esempio, Gujarati↔Swahili o qualcosa. Ogni nuova lingua ancora richiede un investimento ed i dati stati necessario per farlo accadere, in modo da se IBM non sembra avere i dati multilingue stati necessari per una lingua, non la vederete. Se esaminate le offerti di Google, si sono sviluppate col passare del tempo, con soltanto alcune lingue quando ora hanno cominciato e molto. Google presenta un vantaggio qui in quanto possono usare i dati che trovano sul web per creare queste paia, ma IBM non può fare quello e deve contare sui dati interni. Il risultato è che IBM non avrà altrettante lingue, ma, per quelle lingue hanno, i loro dati dovrebbero essere più puliti ed i risultati meglio.

La mia reazione a questo commento è: SCHIFEZZA! n.Fluent non è un nuovo sistema. “È stato in pilota per i 4-5 anni ultimi„ (citati dalla posta del blog di Lionbridge.) che 4-5 anni è un molto tempo. Google nemmeno ha avuto SMT 4-5 anni fa e stava usando Systran. Ora hanno oltre 50 lingue. Quanto ci vorrà IBM/Lionbridge per ottenere le nuove lingue? 10 anni, 20 anni?

O nelle parole di Kirti Vashi:

È realmente motori abbastanza facili da ottenere di SMT che vanno una volta che avete un determinato insieme di dati. L'UE rende questo facile dando un insieme di dati comune in molte lingue di UE, così all'Asia online abbiamo ottenuto i motori 200+ sul posto appena in alcuni mesi. Google ha ottenuto le combinazioni un 1000+ sul posto in 2 anni di caduta dello Systran.

Il ≠ Google di IBM/Lionbridge RTTS traduce?

Il seguente commento, che è stato ricevuto dal sig. Smidt, è sembrato somigliare ad un cinguettare fatto da @LISA_org.

“Non vedo questo e Google tradurre come realmente facendo concorrenza a vicenda (almeno non ancora). Lo scopo di Lionbridge e di IBM è di vendere la tecnologia alle società che la integreranno nei loro prodotti (cioè, questa è puntata sull'impresa non l'utente casuale). Se Google cominciasse aprire gli api puntasse sull'impresa in modo da potrebbero includerlo nei loro propri sistemi, quindi ci sarebbe una certa concorrenza.„

Questo commento sembrerebbe essere falso: si vedano i dati api della borsa degli arnesi del traduttore di Google. Questo api, che sostiene le memorie ed i glossari di traduzione, può essere utilizzato nelle applicazioni di impresa. E parecchie società hanno integrato Google traducono in loro prodotti: un esempio è SDL che ha incorporato Google traduce in sua ultima versione di Trados.

Riassunto

La persona che probabilmente lo ha sommato sul meglio era Kirti Vashi:

Realmente non vedo molto che sia nuovo qui dall'angolo della TA. IBM ora ha avuto SMT per parecchi anni ed ha avuto RbMT per 20 anni. (In effetti IBM ha avuto i brevetti originali di SMT.) Tutti conosciamo che cosa un impatto enorme essi ha avuto sul mondo con queste tecnologie durante questo tempo. (Umm nessuno, forse?) ha preso la partecipazione di Google realmente per fare eccitare di sguardo della TA e MSFT per mostrare come può essere usato per creare il valore reale per il globale cliente con la loro base di conoscenza quale tutti in stanno provando ora a ripiegare.