
נציג המכירות הטוב ביותר שלך כבר כתב אלף אימיילים. כך בינה מלאכותית יכולה ללמוד מכל אחד מהם.
ישבתי מול סמנכ"ל מכירות בחברת SaaS מהשוק הבינוני כשהוא שלף את הטלפון שלו והראה לי את תיבת הדואר הנכנס שלו. הוא גלל בה לאט, כמו חוקר מקרי מוות שמציג ראיות. "תספור כמה מהם נשמעים כאילו בן אדם כתב אותם," הוא אמר.
ספרתי שלושה. מתוך אולי ארבעים אימיילים קרים על המסך שלו. השאר היו דומים באופן מצמרר — אותו קצב, אותה התלהבות חלולה, אותן מילים. "לשחרר." "לשנות." "למנף." הוא סיפר לי שהתחיל לקרוא להם "מקהלת ה-GPT." ארבעים קולות, שיר אחד, ואף אחד לא הקשיב.
השיחה הזאת שינתה את הכיוון של מה שבנינו ב-Veriprajna. עבדנו על מערכות פנייה מבוססות בינה מלאכותית, ושאלנו את השאלה הלא נכונה. התעשייה שאלה: איך גורמים לבינה מלאכותית לכתוב יותר אימיילים? השאלה האמיתית הייתה: איך גורמים לבינה מלאכותית לכתוב אימיילים שנשמעים כאילו הגיעו מהאדם היחיד בצוות שלך שבאמת מקבל תשובות?
ההבחנה הזאת — בין הרחבת הרובוט לבין הרחבת האדם — היא כל המשחק. והתשובה התבררה כארכיטקטורה, לא כפרומפט.
תיבת הדואר היא בית קברות של בינוניות בינה מלאכותית
המספרים מספרים סיפור אכזרי. שיעורי הפתיחה של אימיילים קרים צנחו לכ-27.7%, ירידה מ-36% רק לפני שנה. שיעורי התגובה נעים בין 1% ל-5% ברוב הקמפיינים. המדיום לא גוסס — המסרים הם שגוססים.
הנה מה שקרה: העלות של הפקת אימייל צנחה לכמעט אפס, אז כולם התחילו להפיק אימיילים. השוק הוצף. ומכיוון שרוב הכלים משתמשים באותם מודלים בסיסיים עם התאמה מינימלית, הפלט התכנס. כל אימייל התחיל להישמע כמו כל אימייל אחר. לא כי הבינה המלאכותית הייתה גרועה בכתיבה, אלא כי היא הייתה טובה מדי בכתיבה של הממוצע של כל מה שאי פעם קראה.
מודלי שפה גדולים הם מכונות הסתברות. אם משאירים אותם לנפשם, הם מייצרים את המילה הבאה הסבירה ביותר סטטיסטית, מה שמפיק טקסט חלק, מוכשר ונשכח לחלוטין. זהו המקבילה הלשונית של צבע בז'.
כשכל אימייל של בינה מלאכותית נשמע אותו דבר, "מותאם אישית" פירושו רק שכתבת נכון את שם הנמען.
הכלים שקוראים לעצמם "מותאמים אישית" עושים בעיקר הזרקת משתנים — משתילים {{First_Name}} ו-{{Company_Name}} ואולי שורה על סבב גיוס אחרון. זו התאמה. התאמה אישית היא משהו אחר לגמרי. התאמה אישית היא כשהאופן שבו אתה אומר משהו גורם לנמען להרגיש שאתה מבין איך הם חושבים.
הלילה שבו הבנתי שאנחנו בונים את הדבר הלא נכון
היה לילה — מאוחר, מהסוג של מאוחר שבו אתה לא בטוח אם אתה פרודוקטיבי או סתם עקשן — שבו סקרתי תוצאות של מבחני A/B מאחד מקמפייני הפנייה המוקדמים שלנו. היו לנו שתי גרסאות. גרסה A הייתה האימייל שהופק על ידי הבינה המלאכותית שלנו, מלוטש, מובנה היטב, פוגע בכל הצעות הערך. גרסה B הייתה אימייל מעט מבולגן שכתבה נציגת מכירות בשם פריה. קצר יותר. שבר משפט במקום שלא היה צריך להיות בו. חתימה שהייתה כמעט קז'ואלית מדי.
גרסה B ניצחה בענק. לא במעט. שיעור התגובה היה גבוה כמעט פי חמישה.
אני זוכר שבהיתי בנתונים והרגשתי מבולבל באמת. האימייל של פריה שבר כללים. הוא היה קצר מדי. הפתיחה הייתה חדה. אבל הוא עבד, כי הוא נשמע כמו אדם אמיתי שהיה עסוק וישיר ולא היה לו זמן להתפייט על זה.
אז משהו התחבר לי. הבעיה עם הבינה המלאכותית שלנו לא הייתה שהיא לא ידעה לכתוב טוב. הבעיה הייתה שהיא כתבה כמו בינה מלאכותית. והפתרון לא היה פרומפט טוב יותר — אלא ללמד את המודל לכתוב כמו פריה.
למה שיקוף הסגנון של מישהו באמת עובד?
לפני שאיכנס לארכיטקטורה, אני צריך להסביר למה זה חשוב ברמה הקוגניטיבית, כי זה לא רק נחמד שיהיה.
יש גוף מחקר סביב משהו שנקרא התאמת סגנון לשוני — LSM. הממצא המרכזי הוא שאנשים נוטים באופן משמעותי יותר לבטוח, להתחבר ולהיענות לבקשות ממישהו שסגנון התקשורת שלו משקף את שלהם. זה לא קשור לתוכן. זה קשור למילות פונקציה, למקצב המשפטים, לרמת הפורמליות, למרקם הבלתי מודע של האופן שבו מישהו משרשר מחשבות יחד. מחקר משנת 2013 מאת Ludwig ועמיתיו מצא ששיעורי ההמרה בסביבות מקוונות קשורים ישירות למידת ההתאמה הלשונית בין מסר לנמענו.
זה מתמפה למשהו עמוק אף יותר — נוירוני מראה. כשאתה נתקל בתקשורת שמשקפת את הדפוסים שלך עצמך, היא מפעילה מסלולים עצביים הקשורים לביטוי עצמי. זה מרגיש מוכר. בטוח. שייך לקבוצה. מחקרי משא ומתן הראו ששיקוף מעלה את שיעורי ההסכמה המוצלחת מ-12% ל-67%. נציגי מכירות ידעו את זה באופן אינטואיטיבי במשך עשורים. הסוגרים הטובים ביותר הם זיקיות.
אימייל המכירות הטוב ביותר לא נשמע כמו אימייל מכירות. הוא נשמע כמו הנמען מדבר עם עצמו.
הבעיה היא ששיקוף הוא מיומנות אנושית מטבעה, ידנית מטבעה. היא לא ניתנת להרחבה. אתה לא יכול לגרום לנציג המוביל שלך לחבר באופן אישי אימיילים לעשרת אלפים לקוחות פוטנציאליים. אבל אתה כן יכול ללכוד את מה שגורם לכתיבה שלהם לעבוד ולהזריק אותו למערכת בינה מלאכותית שמייצרת בקנה מידה גדול.
זו התזה. לא "להחליף את האדם." להרחיב את האדם.
מהי הזרקת סגנון מבוססת דוגמאות מעטות, ולמה היא שונה מפרומפט טוב יותר?

פרומפט מבוסס דוגמאות מעטות (few-shot) הוא הטכניקה של מתן קומץ דוגמאות למודל שפה — "הנה שלושה אימיילים שעבדו, עכשיו כתוב אחד כמוהם." זה קיים מאז GPT-3. מה שהופך את הגישה שלנו לשונה הוא מהיכן מגיעות הדוגמאות האלה וכיצד הן נבחרות.
רוב האנשים שמשתמשים בפרומפט מבוסס דוגמאות מעטות בוחרים דוגמאות באופן ידני. הם מדביקים שניים או שלושה אימיילים שהם אוהבים ומסיימים בכך. זה עובד מצוין אם אתה כותב לסוג אחד של לקוח פוטנציאלי. זה מתפרק ברגע שאתה צריך להתאים את הטון עבור CTO לעומת סמנכ"ל שיווק, או עבור קונה פינטק לעומת מישהו בייצור.
מה שבנינו הוא מערכת אחזור דינמית. אנחנו מאחסנים ספרייה אצורה של אימיילים בעלי ביצועים גבוהים, כתובים בידי אדם — מה שאנחנו מכנים "מאגר סגנון" — במסד נתונים וקטורי. כשהמערכת צריכה להפיק אימייל ללקוח פוטנציאלי מסוים, היא לא משתמשת בדוגמאות סטטיות. היא מאחזרת את הדוגמאות המתאימות ביותר מבחינה סגנונית בזמן אמת, בהתבסס על מי הנמען ובאיזה הקשר הוא נמצא.
כתבתי על הארכיטקטורה המלאה בגרסה האינטראקטיבית של המחקר שלנו, אבל התובנה המרכזית היא זו: אנחנו מפרידים בין אחזור תוכן לבין אחזור סגנון. שני צינורות מקבילים. אחד עונה על "מה עלינו לומר?" השני עונה על "איך עלינו לומר את זה?"
ההפרדה הזאת היא הכול. חיפוש סמנטי סטנדרטי מערבב נושא עם טון. אם אתה מחפש "אימייל ל-CTO," אתה מקבל אימיילים על CTOs, לא אימיילים שנכתבו עבור CTOs בקול שאליו CTOs מגיבים. על ידי הפרדה ביניהם, אנחנו יכולים לשלוח מסר על אבטחת ארגונים בטון קז'ואלי וישיר — או פורמלי ומדוד — פשוט על ידי החלפת מסלול אחזור הסגנון.
בניית מאגר הסגנון: היכן שוכן הקסם (והכאב)

כאן אני חייב להיות כן לגבי כמה שהחלק הלא זוהר קשה.
מאגר הסגנון נשמע אלגנטי בתיאוריה. בפועל, בנייתו דורשת חפירה בחודשים של נתוני CRM, הצלבת אימיילים עם תוצאות, סינון מידע מזהה אישית, ולאחר מכן תיוג של כל אימייל ששרד במטא-דאטה — טון, מבנה, פרסונת נמען, שלב עסקה.
הצוות שלי ואני התווכחנו על טקסונומיית התיוג במשך רוב שבוע. האם "ישיר" ו"בוטה" צריכים להיות אותה קטגוריה? האם "אמפתי" הוא טון או מבנה? היכן נגמרת מכירת "אתגר" והיכן מתחיל "תוקפני"? אלה אינן שאלות אקדמיות כשאיכות האחזור שלך תלויה בדיוק התוויות שלך.
התיישבנו על סכמה שמתייגת כל אימייל לאורך ארבעה מימדים: טון (פורמלי, קז'ואלי, דחוף, אמפתי), מבנה (בעיה-החרפה-פתרון, בקשה ישירה, נגיעה עדינה), פרסונת נמען (טכני, פיננסי, תפעולי), ותוצאה (פגישה נקבעה, תגובה התקבלה, אין תגובה). מסד הנתונים הווקטורי — אנחנו משתמשים בהגדרה שממוטבת לאחזור בהשהיה נמוכה — מאחסן גם את ה-embedding וגם את המטא-דאטה הזה, ומאפשר חיפוש היברידי. "מצא לי וקטורים קרובים לפרופיל הסגנון של הלקוח הפוטנציאלי הזה WHERE industry equals SaaS AND outcome equals meeting booked."
הבינה המלאכותית שלך טובה רק כמו האימייל הגרוע ביותר במערך האימון שלך. סגנון זבל פנימה, פלט זבל החוצה.
למדנו את זה בדרך הקשה. בהתחלה, כללנו אימיילים ש"הצליחו" טכנית — הם קיבלו תגובות — אבל התגובות היו דברים כמו "אנא הסר אותי מהרשימה שלך." סינון לפי איכות התוצאה, ולא רק נוכחות של תוצאה, היה לקח שעלה לנו כמה שבועות של תוצאות גרועות לפני שתפסנו את זה.
כיצד המערכת בעצם בוחרת את הסגנון הנכון לכל לקוח פוטנציאלי?
כשלקוח פוטנציאלי חדש נכנס לצינור — נניח, CTO בחברת פינטק — המערכת מריצה תהליך רב-שלבי. ראשית, היא מנתחת את התקשורת הציבורית של הלקוח הפוטנציאלי. פוסטים בלינקדאין, הביו שלו, כל דבר זמין. האם האדם הזה תמציתי? האם הוא משתמש בז'רגון טכני או בשפה פשוטה? האם הוא פורמלי או שיחתי?
לאחר מכן היא מייצרת שאילתת סגנון: "אחזר שלושה אימיילים היסטוריים מוצלחים שנשלחו ל-CTOs בפינטק שמשתמשים בטון תמציתי, ישיר ומעט טכני." מסד הנתונים הווקטורי מריץ חיפוש דמיון קוסינוס ומחזיר את ההתאמות הקרובות ביותר ממאגר הסגנון.
האימיילים המאוחזרים האלה הופכים לדוגמאות מבוססות דוגמאות מעטות בפרומפט. לא סטטיות. לא נבחרות ביד. נבחרות באופן דינמי עבור האדם הספציפי הזה ברגע הספציפי הזה.
שלוש עד חמש דוגמאות זו נקודת המתיקות. פחות משלוש והמודל לא מקבל מספיק אות. יותר מחמש ואתה מתחיל לשרוף אסימוני חלון הקשר בלי שיפור פרופורציונלי — ואתה מסתכן בכך שהמודל יעשה התאמת יתר לדוגמה האחרונה במקום לסנתז את הדפוס לרוחב כולן.
בעיית האמת שאף אחד לא מדבר עליה

הנה משהו שהדיר שינה מעיניי בזמן הפיתוח: הזרקת סגנון יכולה לגרום לבינה מלאכותית לשקר טוב יותר.
כשאתה דוחף מודל שפה חזק לעבר סגנון מסוים — במיוחד סגנון משכנע או קז'ואלי — הוא לפעמים מתחיל לעקם עובדות כדי להתאים לאווירה. היינו רואים אימיילים שבהם הבינה המלאכותית, כשהיא מאמצת את סגנונו של נציג נלהב במיוחד, הייתה מגזימה בעדינות ביכולות המוצר. לא הזיה מכלום, אלא מתיחת האמת בדרכים שהרגישו טבעיות בתוך הסגנון אך היו שגויות עובדתית.
אנחנו קוראים לזה "קריסת אמינות מושרית-סגנון," וזה סיכון אמיתי שאני לא רואה מספיק אנשים בתחום הזה מדברים עליו.
הפתרון שלנו היה ארכיטקטוני, לא רק הוראתי. אנחנו שומרים את הקשר התוכן (עובדות, הצעות ערך, תמחור) ואת הקשר הסגנון (דוגמאות טון) בסעיפים נפרדים של הפרומפט. הוראות המערכת אומרות למודל במפורש: דוגמאות סגנון שולטות בצורה, הקשר התוכן שולט במהות. ואנחנו מריצים שלב אימות משני — מודל "מבקר" שבודק את האימייל שהופק מול חומר המקור העובדתי לפני שהוא יוצא.
לפירוט הטכני המלא של איך זה עובד, כולל ארכיטקטורת האחזור הכפולה והגישה שלנו ל-embeddings של סגנון ניגודי, ראה את מאמר המחקר שלנו.
האם זה מושלם? לא. אבל זה ההבדל בין מערכת שמדי פעם צריכה אדם כדי לתפוס הגזמה לבין מערכת שבאופן שגרתי ממציאה טענות. אני אקח את הראשונה.
"אבל מסנני ספאם לא יתפסו ממילא אימיילים שהופקו על ידי בינה מלאכותית?"
זו השאלה שאני מקבל הכי הרבה, והתשובה נוגדת אינטואיציה: הזרקת סגנון בעצם עוזרת למסירוּת (deliverability).
מסנני ספאם מודרניים — Gmail, Outlook — משתמשים יותר ויותר בבינה מלאכותית כדי לזהות בינה מלאכותית. הם מחפשים פרפלקסיטי נמוכה (perplexity — טקסט צפוי מדי) ואחידות גבוהה (טקסט שחסר את השונות הטבעית של כתיבה אנושית). פלט מודל שפה סטנדרטי חלק כמעט באופן פתולוגי. כל משפט הוא בערך באותו אורך. אוצר המילים נשאב מאותה רצועה צרה. זהו טביעת אצבע סטטיסטית שצועקת "מכונה."
כתיבה אנושית היא מתפרצת. משפט קצר. ואז אחד ארוך יותר שמפתל מעט לפני שהוא מגיע לנקודה שלו. ואז שבר. השונות הזאת — מה שבלשנים מכנים "התפרצותיות" (burstiness) — היא בדיוק מה שהזרקת סגנון מבוססת דוגמאות מעטות מחזירה. על ידי אילוץ המודל להתאים לדוגמאות אנושיות אמיתיות שמכילות שברי משפטים, שאלות רטוריות, ומעברים חדים, הפלט נראה פחות כמו "בוץ בינה מלאכותית" ויותר כמו התכתבות אמיתית.
מטחי בינה מלאכותית גנריים בנפח גבוה הם מסלול מהיר לתיקיית הספאם ולרשימה השחורה של הדומיין. הזרקת סגנון היא הסוואה אנושית עבור המסירוּת שלך.
זווית המוניטין של הדומיין אינה מוערכת מספיק. שליחת אלף אימיילים רובוטיים לא רק נכשלת בהמרה — היא פוגעת באופן פעיל במוניטין השולח שלך, ומקשה על האימיילים העתידיים שלך להגיע לתיבת הדואר הנכנס של מישהו. זהו קנס מצטבר. החברות ששולחות מטחי פנייה גנריים של בינה מלאכותית היום לווים כנגד היכולת העתידית שלהן עצמן לתקשר.
החלק שבו מישהו אומר "פשוט תשתמש ב-GPT"
משקיע אמר לי את זה. לא במילים המדויקות האלה, אבל קרוב. "למה שמישהו ישלם על זה כשהוא יכול פשוט לתת ל-ChatGPT פרומפט לכתוב בסגנון מסוים?"
פתחתי שני אימיילים במחשב הנייד שלי. שניהם נכתבו "בסגנון של מנהיג מכירות ישיר, ללא שטויות." אחד הופק על ידי פרומפט וניל של GPT-4. השני הופק על ידי המערכת שלנו תוך שימוש בשלוש דוגמאות אמיתיות מנציג בעל ביצועים גבוהים שאוחזרו ממאגר הסגנון.
גרסת ה-GPT-4 הייתה בסדר. מקצועית. ברורה. היא נקראה כמו אימייל מכירות מוכשר שנכתב על ידי מישהו שקרא ספר על להיות ישיר.
לגרסת מאגר הסגנון הייתה פתיחה מוזרה. היא התחילה באמצע מחשבה, כמעט כאילו השולח המשיך שיחה שעדיין לא התרחשה. המשפט השני היה בן ארבע מילים. החתימה הייתה רק שם פרטי, בלי תואר, בלי חברה. זה הרגיש כמו מישהו שבאמת עסוק וישיר, לא מישהו שמעמיד פני עסוק וישיר.
המשקיע קרא את שניהם והצביע על השני. "זה. זה נשמע כמו בן אדם."
זה הפער. לתת למודל שפה פרומפט "להיות ישיר" נותן לך את הפרשנות הסטטיסטית של המודל לישירות. להראות לו שלוש דוגמאות אמיתיות של אדם ספציפי שהוא ישיר נותן לך את הישירות של אותו אדם. ההבדל הוא ההבדל בין תיאור דמות לבין מופע.
מה זה אומר לצוותי מכירות (לא מה שהייתם מצפים)
אנשים תמיד שואלים אותי אם זה מחליף נציגי מכירות. זה לא. זה עושה משהו מעניין יותר: זה גורם לכל הצוות שלך להישמע כמו הנציג הטוב ביותר שלך.
חשבו על מה שקורה כשאתם מגייסים SDR חדש. הם מבלים שבועות, לפעמים חודשים, במציאת הקול שלהם. בלמידה של מה עובד. בפיתוח אינטואיציות לגבי טון. עם מאגר סגנון שנבנה מהעבודה הטובה ביותר של בעלי הביצועים הגבוהים שלכם, נציג חדש יכול להתחיל לשלוח אימיילים שנושאים את הקול המוכח של הצוות מהיום הראשון.
הנתונים מרמזים שזה חוסך כ-12.7 שעות בשבוע לכל איש מכירות בזמן ניסוח. אבל הערך האמיתי אינו חיסכון בזמן — הוא עקביות. אין יותר צניחות איכות בבוקר יום שני. אין יותר נציגים שמעולים בטלפון אבל נוראיים בכתיבה. מאגר הסגנון הופך לידע מוסדי, מקודד וניתן לאחזור.
וזה יוצר גלגל תנופה. כל אימייל חדש שמקבל תגובה חיובית מווקטרז ומתווסף למאגר. המערכת משתפרת עם הזמן, לא כי הבינה המלאכותית משתפרת, אלא כי ספריית המצוינות האנושית גדלה.
העתיד הלא נוח
הנה איפה שאעשה תחזית שאולי תזדקן רע: בתוך שנתיים, החברות שעדיין משתמשות בפנייה גנרית של בינה מלאכותית יהיו למעשה בלתי מסוגלות להגיע ללקוחות הפוטנציאליים שלהן באמצעות אימייל. לא כי האימייל מת, אלא כי הדומיינים שלהן יהיו כה פגומים והתוכן שלהן כה מסונן שהן יהיו בלתי נראות.
החברות שינצחו יהיו אלה שהתייחסו לדפוסי התקשורת של אנשי המכירות הטובים ביותר שלהן כאל נכס אסטרטגי — משהו שיש ללכוד, לאצור ולהרחיב. לא להחליף על ידי בינה מלאכותית. להעצים באמצעותה.
קמפיינים המשתמשים בהתאמה אישית מתקדמת והתאמת סגנון כבר מדווחים על שיעורי תגובה של 40–50%, בהשוואה ל-1–8.5% לגישות גנריות. זה לא שיפור שולי. זה ספורט אחר לגמרי.
עידן "היי {{First_Name}}, שמתי לב שהחברה שלך לאחרונה {{trigger_event}}" מסתיים. מה שבא אחר כך הוא התאמה אישית קוגניטיבית — בינה מלאכותית שלא רק יודעת עובדות על הלקוח הפוטנציאלי שלך, אלא מדברת ברגיסטר הספציפי שגורם ללקוח הפוטנציאלי שלך להרגיש מובן.
הנכס בעל הערך הגבוה ביותר במכירות אינו נתוני המוצר שלך. זה האופן שבו האנשים הטובים ביותר שלך מדברים עליו.
לא בנינו את Veriprajna כדי לאוטמט מכירות. בנינו אותה כדי לשכפל את הדבר שהופך אנשי מכירות מעולים למעולים — ולתת את זה לכל אחד בצוות. זה לא הרחבת הרובוט. זה הרחבת האדם. וזו הגרסה היחידה של בינה מלאכותית למכירות שיש לה עתיד.