BYOK — למה זה בלתי-מתפשר בסביבה מפוקחת

ספקי AI מציעים בדרך כלל שני מצבי חיוב: pool משותף שבו משלמים מעטפה קבועה המכסה טוקנים, או מצב BYOK שבו מזינים את מפתח ה-API שלכם ומשלמים ישירות לספק.

ב-SaaS סטנדרטי, ה-pool המשותף נוח. בסביבה מפוקחת — הוא בלתי-ניתן לתמיכה.

הבעיה עם pool משותף

כאשר הספק מעמיד את מפתח OpenAI / Anthropic / Mistral לרשות כל לקוחותיו דרך מפתח-אב יחיד:

מאבדים את הפירוט החשבונאי. אי-אפשר להוכיח לרואה החשבון איזה נפח צרכתם בפועל אצל הספק — הוא מחייב אתכם בסכום מצטבר.
מאבדים את העקבה החוזית. הנתונים שלכם עוברים דרך חשבון הספק. הסכם עיבוד הנתונים (DPA) עם OpenAI כבר לא מכסה אתכם ישירות.
מאבדים שליטה על המודל. הספק יכול לעבור ממודל A למודל B בשקט, מטעמי עלות. ה-benchmarks שלכם מתרסקים ואתם לא יודעים מדוע.
מאבדים ביטול מיידי. במקרה אירוע, אי-אפשר לבטל את המפתח מבלי לפנות לספק.

מה BYOK מבטיח

עם BYOK:

הפרומפטים וההשלמות שלכם עוברים ישירות בין חשבון הספק שלכם ל-betool — לא דרך חשבון צד שלישי משותף.
ה-DPA שלכם עם הספק נשאר השרשרת החוזית היחידה. אין קבלנות-משנה אטומה.
החיוב שלכם קריא: OpenAI מחייב אתכם, אתם רואים כל שורה. betool גובה מכם רק את עלות האורקסטרציה.
הביטול מיידי: מחדשים את המפתח אצל הספק — המודל בלתי-נגיש תוך שנייה.

הגרסה הפרטית — מודלים עצמאיים

לארגונים דורשניים באמת — בנקאות, ביטחון, בריאות — אפילו BYOK אינו מספיק: שליחת פרומפטים ל-OpenAI או Anthropic עדיין מהווה העברת מידע לארצות הברית.

הפתרון הוא מודל פרטי:

Ollama על ה-GPU שלכם, למודלים open-source (Llama, Qwen, Mistral, DeepSeek).
vLLM על אשכול GPU לייצור בעל תפוקה גבוהה.
Azure OpenAI / AWS Bedrock כשיש לכם חוזה ענן פרטי.

הפרומפטים שלכם לעולם לא יוצאים מהפרימטר שלכם. זמן ההשהייה בשליטתכם. הציות — מלא.

מה זה עולה

המיתוס אומר שאחסנה עצמאית של LLM עולה הון. במציאות, עבור מודלים open-source מודרניים ממחלקת Llama 3 / Qwen 2:

שרת GPU bi-A100 80 GB יכול לשרת Llama-3 70B בייצור.
בשימוש מתון (כמה אלפי exchanges ביום), GPU A6000 בודד מספיק לשרת מודל 32B עם זמן השהייה מתחת לשנייה.
עלות פחת חודשית: כ-$2,000 עד $5,000 בהתאם לאסטרטגיית הרכישה (השכרה לעומת קנייה).

בהשוואה לשימוש שקול ב-OpenAI על פני 12 חודשים, ההשקעה מחזירה את עצמה תוך מספר חודשים בנפחים רציניים — וה-ROI מתהפך לחלוטין כשיש אילוצי ריבונות שהופכים את OpenAI לאופציה לא קבילה.

הבחירה שלנו

betool הוא BYOK נייטיב מיום הראשון. אי-אפשר להשתמש בפלטפורמה מבלי לחבר את המפתחות שלכם. זה מכוון:

ה-pool המשותף יוצר חוב ציות שאנחנו מסרבים ליטול על עצמנו עבור לקוחותינו המפוקחים.
האסימטריה בין «לקוחות קטנים» ל«לקוחות גדולים» בנושא ריבונות פשוט לא מקובלת עלינו.
החוויה שאנחנו רוצים לבנות — «אני רואה בדיוק מה אני צורך, היכן, ואצל מי» — אפשרית רק ב-BYOK.

כן, יש כאן מגבלה נוספת ב-onboarding (15 דקות לאחזור מפתח אצל הספק שלכם). אבל זוהי השקעה שמשתלמת לאורך זמן.