JavaRush /בלוג Java /Random-HE /Java וביג דאטה: מדוע פרויקטי ביג דאטה לא יכולים להסתדר בל...

Java וביג דאטה: מדוע פרויקטי ביג דאטה לא יכולים להסתדר בלי ג'אווה

פורסם בקבוצה
במאמרים שלנו על JavaRush, לא נמאס לנו לומר ש-Java, שבקרוב ימלאו לה 25 שנים, חווה כעת את הנעורים השני שלה ויש לה סיכויים מבריקים בעתיד הקרוב. יש לכך מספר סיבות, ואחת מהן היא ש-Java היא שפת התכנות העיקרית במספר נישות מגמתיות וצומחות במהירות של שוק ה-IT. ג'אווה וביג דאטה: מדוע פרויקטי ביג דאטה אינם יכולים להסתדר בלי ג'אווה - 1לרוב, בהקשר של חיבה עמוקה ותחושות עדינות לג'אווה, מוזכרים האינטרנט של הדברים (IoT) וביג דאטה, כמו גם בינה עסקית (בינה עסקית, BI) ו-Real Time Analytics (אנליטיקה בזמן אמת). לאחרונה דנו בקשר בין ג'אווה לאינטרנט של הדברים ודיברנו על איך מפתח ג'אווה יכול "להתאים" את עצמו ואת כישוריו לנישה הזו. עכשיו הגיע הזמן לשים לב לאזור הסופר-טרנד השני, שגם הוא - נכון - אוהב ג'אווה ולא יכול לדמיין את החיים בלעדיה. אז היום אנחנו מנתחים ביג דאטה: מדוע ג'אווה, ולפיכך המקודדים הנאמנים שלה, מבוקשים מאוד גם בנישה זו, איך בדיוק משתמשים בשפה הזו בפרויקטים עם "ביג דאטה", מה ללמוד כדי לקבל את הדרוש מיומנויות לתעסוקה ולעבודה בנישה זו ואילו מגמות רלוונטיות עבור ביג דאטה כרגע, ערב 2020. ובין כל זה, הנה דעותיהם של מומחים ברמה עולמית לגבי ביג דאטה, שלאחריהן אפילו הומר סימפסון ירצה ללמוד איך לעבוד עם "ביג דאטה". ג'אווה וביג דאטה: מדוע פרויקטי ביג דאטה לא יכולים להסתדר בלי ג'אווה - 2
"אני כל הזמן אומר שב-10 השנים הקרובות, בנות לא ירדפו אחרי ספורטאים וסוחרי מניות, אלא בחורים שעובדים עם נתונים וסטטיסטיקות. ואני לא צוחק."
האל וריאן,
כלכלן ראשי בגוגל

ביג דאטה כובש את כדור הארץ

אבל קודם כל, קצת על ביג דאטה ולמה הנישה הזו כל כך מבטיחה לבניית קריירה בה. בקיצור, ביג דאטה חודר באופן בלתי נמנע ויציב, והכי חשוב מהר מאוד, לתהליכים העסקיים של חברות ברחבי העולם, והן, בתורן, נאלצות לחפש אנשי מקצוע שיעבדו עם דאטה (אלה לא רק מתכנתים, כמובן ), מפתה אותם עם משכורות גבוהות וכל טוב אחר. לפי פורבס, השימוש בביג דאטה בארגונים גדל מ-17% ב-2015 ל-59% ב-2018. Big Data מתפשט במהירות למגזרים שונים במשק, כולל מכירות, שיווק, מחקר ופיתוח, לוגיסטיקה והכל. לפי מחקר של IBM, מספר המשרות לאנשי מקצוע בתחום זה בארצות הברית לבדה יעלה על 2.7 מיליון עד 2020. מַבְטִיחַ? עדיין היה.

ביג דאטה וג'אווה

ועכשיו על למה ל-Big Data ול-Java יש כל כך הרבה במשותף. העניין הוא שכלים בסיסיים רבים ל-Big Data נכתבים ב-Java. יתרה מכך, כמעט כל הכלים הללו הם פרויקטי קוד פתוח. המשמעות היא שהם זמינים לכולם ומאותה סיבה הם נמצאים בשימוש פעיל על ידי חברות ה-IT הגדולות בעולם. "במידה רבה, ביג דאטה הוא ג'אווה. Hadoop, וחלק די גדול מהמערכת האקולוגית של Hadoop, כתובים בג'אווה. גם ממשק MapReduce עבור Hadoop הוא Java. אז זה יהיה די קל למפתח Java לעבור ל-Big Data פשוט על ידי יצירת פתרונות Java שיפעלו על גבי Hadoop. ישנן גם ספריות ג'אווה כמו Cascading המקלות על העבודה. Java היא גם שימושית מאוד לניפוי באגים, גם אם אתה משתמש במשהו כמו Hive [Apache Hive היא מערכת ניהול מסד נתונים מבוססת Hadoop]", אמר מרסין מג'רן, מדען נתונים וסגן נשיא להנדסת נתונים בחברת Eight. "מלבד Hadoop, Storm כתוב בג'אווה, וספארק (כלומר העתיד הסביר של Hadoop) כתוב ב-Scala (אשר, בתורו, פועל על ה-JVM, ול-Spark יש ממשק ג'אווה). כפי שאתה יכול לראות, Java ממלאת תפקיד עצום ב-Big Data. כל אלה הם כלי קוד פתוח, מה שאומר שמפתחים בתוך חברות יכולים ליצור עבורם הרחבות או להוסיף פונקציונליות. עבודה זו כוללת לעתים קרובות מאוד פיתוח Java", הוסיף המומחה. כפי שאנו רואים, ב-Big Data, כמו גם באינטרנט של הדברים, למידת מכונה ועוד מספר נישות שממשיכות לצבור פופולריות, ידע בג'אווה יהיה פשוט שאין לו תחליף.
"לכל חברה יש כעת תוכניות ביג דאטה. וכל החברות האלה יגיעו בסופו של דבר לעסקי הביג דאטה".
Thomas H. Davenport,
אקדמאי אמריקאי ומומחה בניתוח תהליכים עסקיים וחדשנות
ועכשיו קצת יותר על כלי הביג דאטה שהוזכרו לעיל שנמצאים בשימוש נרחב על ידי מפתחי Java.

Apache Hadoop

Apache Hadoop היא אחת הטכנולוגיות הבסיסיות ל-Big Data, והיא כתובה ב-Java. Hadoop הוא ערכת קוד פתוח וחינמית של כלי עזר, ספריות ומסגרות המנוהלת על ידי קרן תוכנת Apache. תוכנן במקור עבור מחשוב ניתן להרחבה ומבוזר אך אמין ואחסון של כמויות עצומות של מידע שונה, Hadoop הופכת באופן טבעי למרכז תשתית ה"ביג דאטה" עבור חברות רבות. חברות ברחבי העולם מחפשות באופן פעיל כישרון Hadoop, וג'אווה היא מיומנות מפתח הנדרשת כדי לשלוט בטכנולוגיה זו. לפי המפתחים Slashdot, בשנת 2019, חברות גדולות רבות, כולל JPMorgan Chase עם משכורות השיא שלה למתכנתים, חיפשו באופן פעיל מומחי Hadoop בכנס Hadoop World, אך גם שם לא מצאו מספיק מומחים עם הכישורים הדרושים להם (ב במיוחד, הידע הזה של מודל התכנות והמסגרת לכתיבת יישומי Hadoop MapReduce). המשמעות היא שהמשכורות בתחום הזה יעלו עוד יותר. והם כבר גדולים מאוד. בפרט, Business Insider מעריך את העלות הממוצעת של מומחה Hadoop ב-103 אלף דולר בשנה, בעוד שלמומחי ביג דאטה באופן כללי נתון זה הוא 106 אלף דולר בשנה. מנהלי גיוס המחפשים מומחי Hadoop מדגישים את Java כאחת המיומנויות החשובות ביותר לתעסוקה מוצלחת. Hadoop נמצא בשימוש זמן רב או יושמה לאחרונה יחסית על ידי תאגידים גדולים רבים, כולל IBM, Microsoft ו-Oracle. נכון לעכשיו, גם לחברות אמזון, איביי, אפל, פייסבוק, ג'נרל דינמיק ואחרות יש תפקידים רבים עבור מומחי Hadoop.
"כמו שאין אש בלי עשן, עכשיו אין עסק בלי ביג דאטה".
ד"ר תומס רדמן,
מומחה בעל שם בניתוח נתונים וטכנולוגיות דיגיטליות

אפאצ'י ספארק

Apache Spark היא עוד פלטפורמת ביג דאטה מרכזית שמתחרה ברצינות עם Hadoop. עם המהירות, הגמישות והידידותיות למפתחים שלה, Apache Spark הופך למסגרת המובילה עבור SQL בקנה מידה גדול, נתונים אצווה והזרמת, ולמידת מכונה. בהיותה מסגרת לעיבוד מבוזר של ביג דאטה, Apache Spark פועלת על עיקרון דומה למסגרת Hadoop MapReduce ולוקחת ממנה בהדרגה את כף היד מבחינת השימוש בתחום הביג דאטה. ניתן להשתמש ב-Spark בדרכים רבות ושונות ויש לו קישורים ל-Java, כמו גם למספר שפות תכנות אחרות כמו Scala, Python ו-R. כיום, Spark נמצא בשימוש נרחב על ידי בנקים, חברות תקשורת, מפתחי משחקי וידאו ואפילו ממשלות. כמובן, ענקיות IT כמו אפל, פייסבוק, יבמ ומיקרוסופט אוהבות את אפאצ'י ספארק.

אפאצ'י מאהוט

Apache Mahout היא ספריית לימוד מכונה בקוד פתוח של Java מבית Apache. Mahout הוא בדיוק כלי למידת מכונה שניתן להרחבה עם היכולת לעבד נתונים במכונה אחת או יותר. ההטמעות של למידת מכונה זו נכתבות ב-Java, חלקים מסוימים בנויים על Apache Hadoop.

אפאצ'י סופה

Apache Storm היא מסגרת למחשוב זרימה מבוזר בזמן אמת. Storm מקלה על עיבוד מהימן של זרמי נתונים בלתי מוגבלים, ועושה בזמן אמת את מה ש-Hadoop עושה עבור קבוצות של נתונים. Storm משתלב עם כל מערכת תורים וכל מערכת מסד נתונים.

Java JFreechart

Java JFreechart היא ספריית קוד פתוח שפותחה ב-Java לשימוש ביישומים מבוססי Java ליצירת מגוון רחב של תרשימים. העובדה היא שהדמיית נתונים היא משימה חשובה למדי לניתוח ביג דאטה מוצלח. מכיוון שביג דאטה כרוך בעבודה עם כמויות גדולות של נתונים, זה יכול להיות קשה לזהות מגמה כלשהי ופשוט להגיע למסקנות מסוימות על ידי הסתכלות על נתונים גולמיים. עם זאת, אם אותם נתונים מוצגים בגרף, הם הופכים מובנים יותר וקל יותר למצוא דפוסים ולזהות מתאמים. Java JFreechart למעשה עוזר ביצירת גרפים ותרשימים לניתוח ביג דאטה.

Deeplearning4j

Deeplearning4j היא ספריית Java המשמשת לבניית סוגים שונים של רשתות עצביות. Deeplearning4j מיושם ב-Java ופועל בסביבה התואמת Clojure וכוללת API לשפת Scala. טכנולוגיות Deeplearning4j כוללות הטמעות של מכונת בולצמן מוגבלת, רשת אמונה עמוקה, מקודד אוטומטי עמוק, מקודד אוטומטי מוערם עם סינון רעשים, רשת עצבים רקורסיבית טנזורית, word2vec, doc2vec ו- GloVe.
"ביג דאטה הופכים לחומר הגלם החדש לעסקים."
קרייג מונדי,
יועץ בכיר למנכ"ל מיקרוסופט

ביג דאטה על סף 2020: המגמות האחרונות

2020 אמורה להיות עוד שנה של צמיחה והתפתחות מהירה של ביג דאטה, עם אימוץ נרחב של ביג דאטה על ידי חברות וארגונים בתחומים שונים. לכן, נדגיש בקצרה את מגמות הביג דאטה שאמורות למלא תפקיד חשוב בשנה הבאה. Java וביג דאטה: מדוע פרויקטי ביג דאטה אינם יכולים להסתדר בלי Java - 3

האינטרנט של הדברים - ביג דאטה הולך וגדל עוד יותר

נראה שהאינטרנט של הדברים (IoT) הוא סיפור קצת שונה, אבל זה לא. IoT ממשיך "במגמה", לצבור תאוצה ולהתפשט ברחבי העולם. כתוצאה מכך, גדל גם מספר המכשירים ה"חכמים" המותקנים בבתים ובמשרדים, אשר, כפי שהם אמורים להיות, מעבירים כל מיני נתונים במידת הצורך. לכן, נפח הנתונים ה"גדולים" רק יגדל. כפי שמציינים מומחים, לארגונים רבים יש כבר הרבה נתונים, בעיקר מתחום ה-IoT, שהם עדיין לא מוכנים להשתמש בהם, ובשנת 2020 המפולת הזו תהפוך אפילו יותר גדולה. כתוצאה מכך, גם ההשקעות בפרויקטי ביג דאטה יגדלו במהירות. ובכן, הרשו לנו להזכיר לכם שגם IoT מאוד אוהב את Java . ובכן, מי לא אוהב אותו?

תאומים דיגיטליים

תאומים דיגיטליים הם מגמה מעניינת נוספת של העתיד הקרוב, שקשורה ישירות גם לאינטרנט של הדברים וגם לביג דאטה. ולכן, השימוש בג'אווה בו יהיה די והותר. מהו תאום דיגיטלי? זוהי תמונה דיגיטלית של אובייקט או מערכת אמיתיים. אנלוגי תוכנה של מכשיר פיזי מאפשר לך לדמות תהליכים פנימיים, מאפיינים טכניים והתנהגות של אובייקט אמיתי בתנאים של הפרעות וסביבה. פעולתו של תאום דיגיטלי בלתי אפשרית ללא מספר עצום של חיישנים במכשיר האמיתי הפועל במקביל. ההערכה היא שעד 2020 יהיו בעולם יותר מ-20 מיליארד חיישנים מחוברים, שיעבירו מידע למיליארדי תאומים דיגיטליים. בשנת 2020, מגמה זו אמורה לצבור תאוצה ולעלות לידי ביטוי.

הטרנספורמציה הדיגיטלית תהפוך לחכמה יותר

טרנספורמציה דיגיטלית מוזכרת כמגמה חשובה כבר כמה שנים. אבל הבעיה היא, אומרים מומחים, שלחברות ומנהלים בכירים רבים הייתה הבנה מעורפלת ביותר של מה הביטוי הזה בכלל אומר. עבור רבים, הטרנספורמציה הדיגיטלית פירושה למצוא דרכים למכור את הנתונים שחברה אוספת כדי ליצור מקורות רווח חדשים. עד 2020, יותר ויותר חברות מבינות שהטרנספורמציה הדיגיטלית היא יישום נכון של נתונים על כל היבט של העסק שלהן כדי ליצור יתרון תחרותי. לכן, ניתן לצפות שחברות יגדילו את תקציבי הפרויקטים הקשורים לשימוש נכון ומודע בנתונים.
"אנחנו מתקדמים לאט לאט לעבר עידן שבו ביג דאטה הוא נקודת ההתחלה, לא הסוף".
פרל ז'ו, מחברת ספרי מאסטר דיגיטלי

תוצאות

Big Data הוא עוד תחום פעילות ענק באמת עם הרבה הזדמנויות שבהן מפתח Java יכול למצוא שימוש. בדיוק כמו האינטרנט של הדברים, התחום הזה פורח והוא חווה מחסור חמור במתכנתים, כמו גם במומחים טכניים אחרים. לכן, עכשיו זה הזמן להפסיק לקרוא מאמרים כל כך ארוכים ולהתחיל ללמוד ג'אווה! Java וביג דאטה: מדוע פרויקטי ביג דאטה לא יכולים להסתדר בלי Java - 5
הערות
TO VIEW ALL COMMENTS OR TO MAKE A COMMENT,
GO TO FULL VERSION