½ø½×¿Î³ÌÍÆ¼ö
ΪÁËϵͳµØÕÆÎÕSparkµÄ¸ß¼¶¹¦Ð§ºÍʵ¼ù¼¼Êõ£¬½¨ÒéÄú¼ÓÈëÒÔϼ¸ÃŽø½×¿Î³Ì£º
CourseraÉϵġ°DataSciencewithBigData¡±£ºÕâÊÇÓÉJohnsHopkinsUniversityÌṩµÄ´óÊý¾Ý¿Î³Ì£¬ÆäÖаüÀ¨ÁËSparkµÄ¸ß¼¶Ó¦Óò¿·Ö¡£¿Î³ÌÁ´½Ó£ºDataSciencewithBigDataedXÉϵġ°BigDataAnalysiswithSpark¡±£ºÕâÊÇÓÉUCBerkeleyÌṩµÄ´óÊý¾ÝÆÊÎö¿Î³Ì?£¬ÆäÖаüÀ¨ÁËSparkµÄ¸ß¼¶¹¦Ð§ºÍʵ¼ùÓ¦Óá£
¿Î³ÌÁ´½Ó£ºBigDataAnalysiswithSpark
ͨ¹ýÒÔÉϸ߼¶Êµ¼ùÊÓÆµºÍ¿Î³Ì£¬Äú½«Äܹ»ÕÆÎÕ¸ü¶à¸ß¼¶¹¦Ð§ºÍʵ¼ù¼¼Êõ£¬ÎªÄúÔÚʵ¼ÊÊÂÇéÖеĸßЧʹÓÃSpark´òϼáʵµÄ»ù´¡¡£Ï£ÍûÕâ·ÝÍâ¹úÕý¹æSparkʵ¼ùÊÓÆµÔ¢Ä¿Ö¸ÄÏÄܹ»¶ÔÄúÓÐËù×ÊÖú£¬×£ÄúѧϰÓä¿ì£¬½ø²½Ë³Àû£¡
ÉçÇøºÍÂÛ̳µÄ×÷ÓÃ
ÔÚ¼¼ÊõѧϰºÍÓ¦ÓÃÀú³ÌÖУ¬ÉçÇøºÍÂÛ̳ÊÎÑÝ×ÅÖØÒª½ÇÉ«¡£
StackOverflow£ºÕâÊÇÒ»¸ö¹ãÊܽӴýµÄ±à³ÌÎÊ´ðÍøÕ¾£¬Äú¿ÉÒÔÔÚÕâÀïÌá³öÎÊÌ⣬Ҳ¿ÉÒÔ²é?ÕÒÐí¶à¹ØÓÚSparkµÄÎÊÌâÏ¢Õù´ð¡£Reddit£ºRedditÉÏÓÐÐí¶àÓëSparkÏà¹ØµÄ×Ó°æ¿é£¬ºÃ±Èr/bigdata£¬ÔÚÕâЩ°æ¿éÖУ¬Äú¿ÉÒÔÕÒµ½Ðí¶àʵÓõÄѧϰ×ÊÔ´ºÍÏîÄ¿·ÖÏí¡£
רҵÂÛ̳ºÍÉ罻ýÌ壺¼ÓÈëһЩרҵÂÛ̳ºÍÉ罻ýÌåȺ×飬ºÃ±ÈLinkedInȺ×飬¿ÉÒÔÓëÈ«ÇòµÄSpark¿ª·¢ÕߺÍר¼Ò½»Á÷£¬·ÖÏí¾ÑéºÍѧϰÐĵá£
Á¬ÐøÑ§Ï°ºÍ¸üÐÂ
Spark×÷ΪһÖÖ¿ìËÙÉú³¤µÄ¼¼Êõ£¬Æäа汾ºÍÐÂÌØÐÔ²»¾øÍƳö¡£Á¬ÐøÑ§Ï°ºÍ¸üÐÂÊǼá³Ö¼¼ÊõÇ°ÑØµÄÖØÒªÒªÁì¡£
¹Ø×¢¹Ù·½Í¨¸æ£º°´ÆÚ²é?¿´ApacheSpark¹Ù·½ÍøÕ¾ºÍ¹Ù·½ÓʼþÁÐ±í£¬»ñÈ¡×îеİ汾?¸üкͼ¼Êõͨ¸æ¡£¼ÓÈë¼¼Êõ¼¯»áºÍÑÐÌֻ᣺¼ÓÈëÓë´óÊý¾ÝºÍSparkÏà¹ØµÄ¼¼Êõ¼¯»áºÍÑÐÌֻᣬÌýȡר¼Ò½²½â£¬Á˽â×îеļ¼ÊõÇ÷ÊÆºÍÓ¦Óð¸Àý¡£ÔĶÁ¼¼Êõ²©¿ÍºÍÎÄÕ£ºÐí¶à¼¼Êõ²©¿ÍºÍרҵÎÄÕ»áÏêϸ½²½âеÄSparkÌØÐÔºÍ×î¼Ñʵ¼ù£¬ÕâЩ×ÊÔ´¿ÉÒÔ×ÊÖúÄú¼á³Ö¼¼Êõ¸üС£
¸ß¼¶¹¦Ð§Ñ§Ï°
SparkSQLºÍDataFrame£ºÔÚ»ù´¡²Ù×÷Ö®ºó£¬ÄúÐèÒªÉîÈëѧϰSparkSQLºÍDataFrame¡£ÕâЩ¹¤¾ß¿ÉÒÔ×ÊÖúÄú¸ü¸ßЧµØ½øÐÐÊý¾ÝÅÌÎÊºÍÆÊÎö¡£ÊÓÆµÁ´½Ó£ºSparkSQLandDataFramesԢĿ½¨Ò飺Õâ¸öÊÓÆµÏêϸ½²½âÁËÈçºÎʹÓÃSparkSQLºÍDataFrame½øÐÐÊý¾ÝÅÌÎÊ£¬²¢Í¨¹ýʵ¼Ê°¸ÀýչʾÁËËüÃǵĸßЧӦÓá£
»úеѧϰ¿âMLlib£ºSparkÌṩÁËÒ»¸öÇ¿´óµÄ»úеѧϰ¿âMLlib£¬Ëü¿ÉÒÔ×ÊÖúÄúʵÏÖÖÖÖÖ»úеѧϰËã·¨¡£ÊÓÆµÁ´½Ó£ºMLlibMachineLearningLibraryԢĿ½¨Ò飺Õâ¸öÊÓÆµÏêϸ½éÉÜÁËSparkµÄMLlibÍâ¹úÕý¹æSparkʵ¼ùÊÓÆµÔ¢Ä¿Ö¸ÄÏ£º½ø½×ƪ
У¶Ô£ºÖÜéó¾ý(1C0m4pJyqZtPma0S7t9ZFfz4hTykKag)


