علم داده، یک چند رشته ای ترکیبی از استنتاج داده، توسعه الگوریتم، و فن آوری است که به منظور حل تجزیه و تحلیل وار مشکلات پیچیده به کار می رود.در درون هرچیزی داده نهفته است. از تحلیل و کاوش در داده ها چیزهای بسیاری برای یادگیری وجود دارد. قابلیت های پیشرفته ای که ما می توانیم از آنها استفاده کنیم. علم داده، درباره استفاده از داده در خلق روش هایی است که ارزش تجاری ایجاد کند.
علم داده – کشف و درک داده ها
این جنبه از علم داده، همه چیزهای کشف شده از داده است. غواصی در سطح خرد برای کاوش و فهم رفتارها، ترندها و روندهای پیچیده است. علم داده، درباره درک نکات پنهانی است که می تواند کمک کند شرکت ها تصمیمات تجارب هوشمندانه تری اتخاذ کنند. برای مثال:
داده های نتفلیکس، الگوهای مشاهده فیلم را برای درک این که چه چیزهایی باعث ایجاد علاقه کاربر می شوند داده کاوی می کند، و از آنها استفاده می کند تا تصمیماتی که لازم است نتفلیکس در مورد سریال هایی که قرار است ساخته شوند بگیرد.Target، مشخص می کند که بخش های اساسی که مشتری به آنها توجه می کند و رفتارهای خرید منحصر به فرد در این بخش ها چگونه است که کمک می کند که مخاطبان بازارهای هدف بیشتر مورد شناسایی قرار بگیرند. Proctor& Gamble، از مدل های سری زمانی استفاده می کند تا تقاضای آینده را درک کند که کمک می کند تا سطوح تولید به صورت بهینه تری برنامه ریزی شوند.
همچنین بخوانید در پیویو :
دانشمندان داده ، چگونه داده کاوی می کنند؟
در ابتدا کار با اکتشاف داده پیش می رود. هنگامی که یک پرسش چالش برانگیز مطرح می شود، دانشمندان داده، تبدیل به کارآگاهانی می شوند که شروع به تحقیق و پژوهش می کنند و سعی می کنند الگوها و یا مشخصه های داده را درک کنند. این نیاز به میزان بسیار زیادی از خلاقیت تحلیلی دارد.سپس در صورت لزوم، دانشمندان داده ممکن است روش های کمی را برای دستیابی به سطح عمیق تر مانند مدل های استنباطی، تجزیه و تحلیل تقسیم بندی، پیش بیمی سری های زمانی، آزمایش های کنترل ترکیبی و غیره را به کار بگیرند. هدف این است که قطعه ها به نحوی کنار یکدیگر قرار بگیرند که یک دید تحلیلی از آنچه داده واقعا درباره آن است به دست آید.این بینش داده محور، برای ارائه راهنمایی استراتژیک بسیار مهم است. در این مورد، دانشمندان داده به عنوان مشاور، و راهنمای ذی نفعان کسب و کار عمل می کنند تا بر اساس یافته ها تصمیم گیری شود.
علم داده – توسعه کالای داده
یک محصول یا کالای داده ، نوعی دارایی فنی است که:
- از داده به عنوان ورودی و اینپوت استفاده می کند
- داده را برای بازگشت به نتایج حاصل الگوریتم پردازش می کند.
نمونه کلاسیک محصول یا کالای داده، موتور پیشنهاد دهنده است که داده کاربر را مصرف کرده و پیشنهادات شخصی سازی شده بر اساس داده ارائه می دهد.موتورهای پیشنهاد دهنده آمازون، مواردی را به شما پیشنهاد می دهند خریداری کنید که به وسیله الگوریتم هایشان تعیین و معرفی شده اند. نتفلیکس فیلم هایی را به شما پیشنهاد می کند و توصیه می کند و یا اسپتیفای، موسیقی هایی را به شما توصیه می کند که همگی بر اساس الگوریتم هایشان معرفی می شوند.فیلتر اسپم جی میل، هم یک محصول کالا است یک الگوریتم در پشت صحنه پردازش ایمیل های ورودی وجود دارد و تعیین می کند که یک ایمیل، اسپم است یا نه. دید رایانه ای یا کامپیوتری، که از اتومبیل های خود راننده استفاده می کند هم کالای داده است که با الگوریتم های یادگیری ماشینی کار می کند و قادر است که چراغ های ترافیک، اتومبیل های دیگر، افراد پیاده و غیره را تشخیص دهد.
محصول کالا، متفاوت از بینش و درک داده است که در بخش بالایی به آن پرداختیم. جایی که خروجی، احتمالا توصیه هایی را به تیم اجرایی می دهد تا تصمیم تجاری و کسب و کاری هوشمندانه تری را اتخاذ کنند. در مقایسه، یک محصول داده، عملکردی فنی محسوب می شود که از یک الگوریتم تشکیل شده است و برای این که مستقیما در برنامه های هسته یکپارچه شود طراحی شده است. مثال های مهم از برنامه های کاربردی که از کالای داده یا محصول داده در پشت صحنه خود استفاده کرده اند: صفحه اصلی آمازون، صندوق ورودی جی میل، و نرم افزارهای رانندگی مستقل است.دانشمندان داده نقش مهمی در توسعه کالای داده ایفا می کنند. کالای داده، درگیر ساخت و ایجاد الگوریتم، تست، بهبود، پالایش، و توسعه فنی سیستم های تولید است. در این مورد، دانشمندان داده نقش توسعه دهندگان فنی را ایفا می کنند و asset هایی را می سازند که می تواند در مقیاس وسیع مورد استفاده قرار گیرد.
مجموعه مهارت های لازم برای علم داده چیست؟
برای کار کردن در حوزه علم داده، باید این سه مهارت اساسی را داشته باشید.
- خبرگی در ریاضیات
- تکنولوژی و هک
- تیزهوشی تجاری
-
خبرگی در ریاضیات
در قلب درک داده کاوی و توسعه کالای داده، باید توانایی نگاه کردن به داده از لنز کمّی وجود داشته باشد. در داده، مسائلی چون بافت، بعد و همبستگی وجود دارد که می تواند به صورت ریاضی بیان شود. یافتن راه حل با استفاده از داده، نیاز به تکنیک کمی و اکتسافی دارد. راه حل برای بسیاری از مسائل تجاری و مرتبط با کسب و کار، با مسائلی چون ایجاد مدل های تحلیلی سر و کار دارد که بخشی از ریاضی است.همچنین یک تصور غلط این است که علم داده فقط درباره آمار است. گرچه آمار هم مهم است اما تنها قسمت از علم ریاضی نیست که در علم داده کاربرد دارد. البته باید توجه داشت دو شاخه از آمار وجود دارد که شامل آمار کلاسیک و آمار بیزی می شود. هنگامی که بیشتر افراد به آمار اشاره می کنند منظورشان آمار کلاسیک است اما داشتن دانش درباره هر دوی این آمارها برای علم داده لازم است.
2-فناوری و هک
اجازه بدهید به شما بگوییم که منظور از هک، این نیست که به رایانه ها نفوذ کنیم. بلکه اشاره به خرده فرهنگ برنامه نویس فن آوری دارد. یعنی خلاقیت و نبوغ در استفاده از مهارت های فنی برای ساخت چیزها و یافتن راه حل های هوشمندانه و روشن برای مشکلات
3-تیزهوشی کسب و کار
برای دانشمند داده مهم است که مشاور تاکتیکی در زمینه کسب و کار باشد. بنابراین داشتن این مهارت هم برای وی ضروری است.در این مقاله راجع به این که علم داده چیست چه کاربردهایی دارد و برای فعالیت در این عرصه، باید چه مهارت هایی را داشت صحبت کردیم.
نظرات کاربران