תיעוד

טלפוניה בזמן אמת

קול נכנס / יוצא דרך LiveKit + SIP, ASR/TTS streaming, barge-in, רב-לשוני.

טלפוניה בזמן אמת

ערוץ הטלפוניה מאפשר ל-pipeline של betool לקבל שיחות או לחייג החוצה. אודיו בזמן אמת, תמלול streaming, סינתזת קול בהשהייה נמוכה, תמיכה בהפרעה (barge-in).

ארכיטקטורה

מתחת למכסה:

  • LiveKit מנהל את תעבורת האודיו בזמן אמת.
  • LiveKit-SIP מחבר בין LiveKit לבין trunk הספק שלכם (SIP).
  • worker ייעודי מתזמר את השיחה: ASR (Deepgram, OpenAI Whisper), LLM (Claude, GPT-4o, מודל פרטי), TTS (ElevenLabs, OpenAI TTS, Azure).

ערמת הטכנולוגיות הזו פועלת בתהליך נפרד מה-backend הראשי. אינכם מגדירים אותה ישירות — מפעיל המופע שלכם הוא שמקים את גשר ה-SIP.

דרישות מוקדמות

  • trunk SIP אצל ספק (Twilio, Voxbone, OVH, Sewan, או ספק מקומי).
  • מספר נכנס ו/או יכולת ביצוע שיחות יוצאות.
  • מפתח אצל ספק ASR ו-TTS — או מודל פרטי בתוכנית Enterprise.

בתוכנית Enterprise, betool יכולה לבצע provisioning של trunk ה-SIP וספקי הקול עבורכם. אחרת, הזינו את ה-credentials בממשק הניהול.

הגדרה בצד הניהול

  1. ניהול → טלפוניה → Trunks — הזינו את ה-credentials של ה-SIP מהספק שלכם.
  2. ניהול → טלפוניה → מספרים — שייכו מספר ל-trunk ולאחר מכן ל-pipeline יעד.
  3. ניהול → מודלי קול — בחרו את ה-ASR (כניסה) וה-TTS (יציאה). מוני היחידות מוצגים.

תכנון pipeline קולי

pipeline קולי מתחיל תמיד בצומת Start עם receiver מסוג phone_gateway. מנקודה זו, ה-pipeline מקבל:

  • exchange.user_message — כל סבב דיבור שתומלל
  • exchange.intent — כוונה שזוהתה (אם הפעלתם סוכן classifier)
  • exchange.channel.source_type — שווה ל-phone_gateway

הצמתים בהמשך הזרם יכולים להחזיר טקסט שייקרא בקול על ידי ה-TTS. tools קוליים ייעודיים (barge-in, hangup, העברה, מוזיקת המתנה) זמינים אוטומטית לסוכנים כאשר ה-pipeline כולל phone_gateway במעלה הזרם.

שיטות עבודה מומלצות

  • שמרו על משימות קצרות. זמן העיבוד חשוב: סוכן שמהסס 4 שניות נשמע קפוא בטלפון. העדיפו מודלים מהירים (Haiku, GPT-4o-mini) פרט לסיבובים המכריעים.
  • הפעילו barge-in. המתקשר חייב להיות מסוגל להפסיק את הסוכן. זו ברירת המחדל.
  • הגבילו לולאות. pipeline שחוזר יותר משלוש פעמים על אותו סיבוב מייצר שתיקה מדאיגה למתקשר. עקבו אחר מונה האיטרציות.

עלויות

ראו תעריפים. אינדיקטיבי: 200 קרדיטים לדקת שיחה + ASR / TTS / LLM. שיחה של 5 דקות עולה בדרך כלל $0.20 עד $0.80 בהתאם למודל ה-LLM שנבחר.

מגבלות ידועות

  • עדיין אין תמיכה בוידאו.
  • העברה לנציג אנושי דורשת trunk SIP התומך ב-REFER (Twilio תואם).
  • הסוכן עדיין אינו יכול לזהות את זהות המתקשר ללא אינטגרציית CRM.