חזרה לחדשות
סוכני קול בסביבת ייצור: השהיה, שפות, והפרטים המשעממים שעושים את ההבדל
6 דקות קריאהמאת Andre Ross

סוכני קול בסביבת ייצור: השהיה, שפות, והפרטים המשעממים שעושים את ההבדל

ארכיטקטורה מעשית לסוכני קול רב-לשוניים על מספרי טלפון אמיתיים.

computer-visionedgesmart-cities

בינה מלאכותית קולית היא אחת מאותן בעיות שנראות פתורות בהדגמה ומתפרקות ברגע שמרימים שיחה אמיתית. רעשי רקע, מתקשרים שעוברים בין שפות באמצע משפט, מבטאים אזוריים שהמודל מעולם לא נחשף אליהם, מעל 30 שפות שכל אחת מתנהגת אחרת באובדן חבילות, וכלל אחד נוקשה שאף אחד לא מזהיר אתכם מפניו: אם הסוכן לא מתחיל לדבר בתוך 800 מילישניות בערך, האדם בצד השני משוכנע שהקו נפל.

ברירת המחדל שלנו היא ארכיטקטורת תזמור היברידית. ה-Phone API מטפל במפעילי התקשורת, במספרים הייעודיים ובניתוב השיחות; ה-Voice API מטפל בזיהוי הדיבור ובהפקתו; שכבת התזמור שלנו ביניהם מחזיקה את מצב השיחה, את השאילתות למאגר הידע ואת הכוונון לכל שפה בנפרד. מעלים PDF, DOCX או כתובת URL — והסוכן עונה מתוכם, בלי צנרת נוספת ובלי אינדקס נפרד לכל שפה. החיוב מתבצע בטעינה מראש ולפי דקות, כך שהעלות נצפית בזמן אמת במקום להגיע כהפתעה בסוף החודש.

טיפ מעשי: התייחסו להשהיית הטוקן הראשון *כדרישת מוצר מסדר ראשון*, לא כתוספת נחמדה. אנחנו מודדים אותה לכל שפה, לכל אזור ולכל שעה ביום, וחושפים את המספרים למפעילים בלוח הבקרה. הסוכנים שסוגרים שיחות בהצלחה הם לא אלה עם המודל המתוחכם ביותר — הם אלה שמתחילים לדבר לפני שהמתקשר מספיק לתהות אם בכלל יש מישהו בקו.

תפסיקו לפספס שיחות. התחילו עם $5 חינם.

העלאת סוכן קולי AI ראשון תוך דקות — בלי כרטיס אשראי, בלי מנוי, בלי התחייבות.