11 אוקטובר 2022
היום אני הולך לפתוח נושא גדול חדש בבלוג שלנו ב- EduLabs. אם הייתי כותב את הבלוג הזה באנגלית, הייתי קורא לזה thread (המונח שידוע לכל מתכנת). זה הוא לא סוד כי אנחנו ב-EduLabs פועלים במספר מישורים. בנוסף לייעוץ לחברות הייטק בתחום בינה מלאכותית וקורסי העשרה עבורם, אנו מעבירים גם קורסי תכנות ליחידים. בפרט ההתמחות של EduLabs ליחידים היא קורס Full Stack לנינג׳ות העתידיות של ההייטק הישראלי. במהלך פעילותינו בתחום זה אנו פוגשים הרבה אנשים אשר היום בוחרים מה ללמוד ושמעו על תחום ההייטק כתחום עם משכורות גבוהות, תנאי עבודה נפלאים וביקוש שוק מטורף. אך רובם המוחלט של הסטודנטים העתידיים לא יודעים על מה מדובר במובן הטכני. רבים מהאנשים שרוצים להיכנס להייטק, תוהים האם תחום ההייטק זה בשבילם, האם זה מעניין אותם והאם הם מתחברים לתחום הזה. הרבה מהמתלבטים בבחירת מסלול לימודי, חושבים כי בהייטק אנשים יושבים 8 שעות מול המחשב וזה משעמם. חלק מהאנשים פונים למומחים כגון יועצי לימודים, אשר יכולים לעזור ולכוון אותם. יחד עם זאת, כל אחד מבין שאם תפנו ל-10 יועצים שונים, תקבלו 10 ייעוצים שונים, וזה נפלא. אני אישית חושב שאין מספיק חומרים מעניינים המסבירים על ההייטק מבחינת הטכנולוגיות העדכניות שיש לנו היום ומה שמצפה לנו בעתיד. לכן החלטתי לנסות לכתוב קצת יותר על הטכנולוגיות המגניבות של ההייטק אותם מפתחים מתכנתים מהשורה ואולי יום אחד גם אתם ,הקוראים של הכתבה הזו, תוכלו לפתח בעצמכם. אני חושב שדרך הדברים המגניבים שתראו בעיניכם, ואולי תתנסו בעצמכם, יהיה ניתן לעורר בכם עניין, תשוקה ורצון להיות חלק מהעולם המגוון, הדינמי והמגניב של ההייטק. לדעתי אם תהיה לכם תשוקה ליצור דברים חדשים ומגניבים בהם משתמשים מיליוני אנשים מסביב לעולם כגון WatsApp YouTube או GMail אתם פשוט לא תוכלו לסרב לעבוד בהייטק. לענייננו. הפעם אני בחרתי בטכנולוגיה חדשה בתחום בינה מלאכותית. אני הולך לדבר על חברת Midjourney והמוצר המגניב שלהם.
EduLabs
ספק רשמי של הטכניון
בנושאי תוכנה ובינה מלאכותית.
היא חברה בתחום בינה מלאכותית המפתחת טכנולוגיה בעזרתה תוכלו ליצור יצירות אמנות בצורה של תמונה בעזרת מספר מילים בלבד. מייסד של החברה הוא David Holz בעל יותר מ-110 פטנטים ועבודות מחקר. החברה התחילה את פעילותה באוגוסט 2021 וכעבור שנה הוציאה את המוצר ההתחלתי שלה בגרסת בטא לכלל הציבור. אני ממליץ לכם בחום להיכנס ולהתנסות בעצמכם, אם עדיין לא יצא לכם לעשות זאת.
עכשיו תנסו לנחש איזו תמונה מתוך שלושת הפורטרטים הבאים נוצרה ע״י בינה מלאכותית של Midjourney? קחו את הזמן, תגדילו את התמונה ואל תמהרו… זהו, בחרתם? במידה ואתם רוצים לדעת את התשובה הנכונה תמשיכו לקרוא. אז אנו יודעים כי אחת מהתמונות האלו נוצרה ע״י אלגוריתמיקה של בינה מלאכותית דרך מילים, אבל איך?
טוב, זה די פשוט אמנם לא רגיל כי Midjourney היא לא אפליקציה במובן הרגיל אלא היא פועלת דרך תשתית אפליקצית המסרונים של Discord. בישראל משתמשים יותר ב-Slack אך Discord תופסת יותר ויותר תאוצה בזמן האחרון. כדי להשתמש ב-Midjourney אתם חייבים שיהי לכם חשבון ב-Discord. חשבון ב- Discord הוא חינמי וניתן להשתמש בו הן דרך אפליקציה במחשב / בדפדפן והן דרך אפליקציות בסמארטפונים (אנדרואיד, אייפון ).
אחרי יצירת חשבון עליכם להתחבר לקבוצה של Midjourney בקישור זה. מטעמי נוחות שלי בכתיבת הכתבה הזו אני הולך להשתמש בDiscord דרך הדפדפן Chrome.
בסופו של דבר אתם מגעים למסך כאשר בצד השמאלי שלו יש לוגו עם אוניה (Midjourney), ועמודה מימינה כוללת בתוכה chat rooms בהם אנשים כמוכם כבר משחקים עם הטכנולוגיה. תבחרו אחד מה newcomers rooms, למשל אני בחרתי ב newbies-103 ותתחילו לגלול ולראות מה אנשים אחרים מנסים ליצור. אם אתם מוכנים להתחיל את היצירה שלכם, אז תתחילו לדמיין מה ברצונכם לצייר. והאמת היא שכל תהליך היצירה מתחיל מהמילה imagine. זה עובד בצורה הבא, אתם צריכים לתאר במילים מה אתם רוצים שהבינה המלאכותית תצייר בשבילכם. ניתן להתחיל מהדברים הפשוטים ביותר. תצטרפו אלי, אני הולך לבקש מבינה מלאכותית ליצור תמונת פורטרט של ארנב כנפוליאון על רקע כהה (אותו כבר ראיתם כתמונה ראשית לכתבה הזו). אז הפקודה צריכה להתחיל מ:
/imagine (space bar/enter key)
ואז בתוך החלון prompt כותבים מה אתם רוצים ליצור. הדוגמא שלי על התמונה:
/imagine prompt (bunny as napoleon, hyperrealistic, octane render, dark background, extremely detailed --ar 1:1 )
ושולחים הודעה.
אתם יכולים לעקוב אחרי ההתקדמות של ההתהליך ביצירת התמונות הראשוניות. בתמונה שמתחת, בינה מלאכותית סיימה 37% מיצירת 4 התמונות הראשוניות, וכבר כאן ניתן לראות כי צורת הארנב מופיעה בכל התמונות. וכשהכל מסתיים אתם מקבלים תוצאה הבאה עם 4 פתרונות ראשוניים ומספר אופציות להמשך. בואו נעבור עליהם.
אלו הם פתרונות ראשוניים ועליכם להמשיך ולחפש דברים שאתם אוהבים יותר. מכאן יש לכם מספר אפשרויות:
סידור התמונות הולך משמאל לימין ומלמעלה למטה, כמו בדיאגרמה בתמונה הבאה:
זה הוא האלגוריתם הראשוני והפשוט ביותר ליצור תמונות מהממות. חדי העין שמו לב כי חוץ מפקודת : bunny as napoleon, dark background, יש לי גם תוספת כלשהי: hyperrealistic, octane render, extremely detailed --ar 1:1 אלו הם דברים קצת יותר מתקדמים אשר משפיעים על צורת רינדור ועיצוב של התמונה. יש המון אופציות אשר ניתן להשמיש על אותה תמונה, אבל בדוגמה שלי אני מבקש לעשות רינדור ריאליסטי עם הרבה פריטים ותמונה מרובעת. חפשו קישורים לכל האפשרויות עם הסברים מפורטים בסוף הכתבה.
בואו נצלול פנימה על איך זה עבד אצלי עם הארנב. לא אהבתי שום תמונה ראשונית לכן ביקשתי לייצר אופציות חדשות (🔄 ). קחו בחשבון כי בצ׳אט הזה נמצאים עוד מאות משתמשים כמוכם ואתם תראו כי הפיד זז מהר ולפעמים יכול לקחת עד דקה או שתיים עד שבינה מלאכותית תייצר תמונות עבורכם. למטה אני מצרף תהליך התכנסות שלי לתמונה הרצויה.
בנקודה הזו אני חייב להזהיר אתכם כי כל התהליך ממכר מאוד ועלול לשאוב אתכם פנימה למספר שעות. גרסה חינמית של השירות הזה מוגבלת והשירות בתשלום מתחיל מ $10 לחודש. ניתן ללמוד עוד על כל מיני פרמטרים המשפיעים על התוצאה הסופית שלכם.
תוכנה המבוססת על בינה מלאכותית היא כמו מוח של תינוקת. עם הזמן תינוקת גדלה ולומדת דברים חדשים שהיא פוגשת בחיים. למשל מה זה אבטיח? איך הוא נראה? באיזה צבעים הוא קיים? איך מציגים אותו אנשים שונים וכו… כך גם תוכנה בבינה מלאכותית. מתכנתים או חוקרים מייצרים רשת נוירונים רחבה עם קשרים בין הנוירונים, בדומה לאיך שהמוח שלנו נראה. בגדול נוירונים בבינה מלאכותית הן פונקציות (משוואת) יחסית פשוטות והקשרים הם המשקולות היחסיים של השפעת אותם המשוואות אחת על השניה. בהתחלה רשת נוירונים ריקה ויש צורך ללמד אותה. בבינה מלאכותית שמזהה עצמים בתמונה, אוספים אלפי תמונות שונות עם אותו פריט על התמונה, למשל אותו אבטיח, ומסמנים על התמונה מקום בו נמצא אבטיח. את התמונות המתויגות האלה מזינים לרשת נוירונים ומבקשים ממנה ללמוד חוקיות, או במילים אחרות להגדיר משקולות המשפיעות על זיהוי פריט זה.
לאחר למידה זו, תוכנת בינה מלאכותית תוכל לזהות אבטיח בתמונה, לסמן את מקומו בתמונה ואפילו להודיע על אחוזי ביטחון בזיהוי (למשל 97% זה אבטיח). כמובן אני מפשט את ההסבר שלי רק לצרכי הבנה כללית. פתרון של Midjourney הוא הרבה יותר מסובך ויכול להיות מורכב ממספר רשתות נוירונים כל אחת אחראית על חלק שונה. במידה ומעניין אתכם להבין קצת יותר על איך עובדת בינה מלאכותית, אני ממליץ לראות וידאו עם ולריה איינבינדר , שנתנה הרצאה ב -Google Campus בתל אביב:
Deep Learning Fundamentals For Indie Hackers by Valeria Aynbinder
טכנולוגיות מהסוג הזה הם מהפכניות ומשפיעות רבות על החיים שלנו. היום יש לנו שירותים כמו Shutterstock המציעים תמונות ווידאו לכתבות ופוסטים. לפעמים יכול לקחת לכם שעות עד שתמצאו את התמונה הרלוונטית בדיוק כמו שאתם מדמיינים בראש, ולפעמים לכל תמונה כזו כבר יש מספר כתבות. לעומת זאת טכנולוגיות בינה מלאכותית מאפשרות לייצר פיסות אמנות ייחודיות ומותאמים לפי מה שאתם מחפשים. יתרה מכך, השלב הבא הוא ליצור וידאו, וטכנולוגיות אלו כבר מתחילות לצוץ. כמו שאמרתי קודם, תחום ההייטק הוא תחום סופר דינמי, מגוון ומעניין, זהו התחום שיש לו עתיד ענק וחשוב בחיי החברה ולא רק. וכמעט שכחתי לגבי חידת השנה... כל התמונות אלו נוצרו בעזרת Midjourney.
נתראה בכתבות הבאות.