مقدمه

برای ورود به دنیای شغلی جذاب و پرتقاضای تحلیل داده نیاز است تا در دو بُعد فنی (نرم افزاری) و نرم (غیرفنی) مهارت های لازم را داشته باشید. در این مطلب آموزشی قصد داریم شما را با مسیر یادگیری فنی (نرم افزاری) تحلیل داده آشنا کنیم. البته ابزارها و نرم افزارهای مختلفی برای پیاده سازی گزارشات و رسیدن به تحلیل‌ها وجود دارد اما پیشنهاداتی که در این مطلب ارائه می‌شود کاملا تجربه شده و عملی بوده و سال ها در کشورمان ایران و حتی توسط دانشجویانمان در سایر کشورها نیز مورد استفاده قرار گرفته است.

توضیحات صوتی

مسیر فنی ابزارهای تحلیل داده پوریا بغدادی

نرم افزار Excel

ابزارهای اکسل برای تحلیل داده

خواه نا خواه اکسل نرم افزاری جامع و فراگیر است و هرفردی بسته به نیاز، شغل، هدف و فعالیت خود از آن استفاده می کند. در واقع اکسل یک ابزار جامع است که مخاطبان مختلف و متفاوتی دارد. از دستیار مدیر عامل یا مدیر یک ساختمان گرفته تا مسئول کنترل پروژه یک شرکت پیمانکاری و یا یک حسابدار حرفه ای هرکدام از اکسل به نحوی استفاده می کنند. این بدان معناست که در اکسل ابزارها و توابع گوناگونی وجود دارد. اما از منظر تحلیل داده اکسل حاوی یکسری ابزارهای مشخص می باشد که در اینجا به عناوین هریک اشاره می کنیم:

Table, Sort, Filter, Charts, Pivot Table, Vlookup, Xlookup, IF, Sum, Sumif, Subtotal, Analysis Toolpak, Solver, What-if, …

نحوه یادگیری ابزارها

شما می توانید این عناوین را با جستجو در اینترنت یاد بگیرید و لزوما نیازی به شرکت در دوره اکسل آفلاین یا آنلاین یا حضوری نیست چرا که به عنوان مثال دوره آموزشی جامع اکسل کاربردی به تدریس آقای پوریا بغدادی حاوی مباحث کاملی در خصوص فرمول نویسی کاربردی و گزارش گیری با Pivot Table می باشد و لزوما در این دوره آموزشی ابزار های تحلیل داده بطور کامل پوشش داده نشده است چرا که هدف از تدریس اکسل آموزش دادن این نرم افزار برای استفاده در شرکت ها و مشاغل مختلف بوده و رویکرد تحلیل داده نداشته است.

به طور کلی برای یادگیری نرم‌افزار اکسل نیاز به صرف چند ماه زمان وجود دارد. البته یادگیری اکسل انتها ندارد و بعد از آشنایی با این نرم افزار شما وارد یک مسیر جذاب و همیشگی خواهید شد اما برای یادگیری این نرم‌افزار با رویکرد تحلیل داده لزوماً نیازی به صرف زمان زیاد ندارید و حتی می توانید برای آن انتهای مشخصی متصور شوید.

زمان یادگیری

برای یادگیری اکسل با هدف تحلیل داده یعنی ابزارهایی که بالاتر به آن ها اشاره شده نیاز به صرف زمان زیادی ندارید. شاید روش بهتر این باشد که ابزارهای یاد شده را در هنگام کار و یادگیری نرم‌ افزار Power BI (گام بعدی ابزارهای تحلیل داده) به طور موازی یاد بگیرید بدین معنا که هرجا به یک نیاز جدید برخورد کردید ابزار آن در اکسل را پیدا کرده و یاد بگیرید. با این روش هم اضطراب و نگرانی شما برای یادگیری اکسل کم می‌شود و هم بر اساس نیازهایی که به وجود می‌آید به سراغ ابزارها می‌روید پس کیفیت و سرعت یادگیری بسیار بالاتر خواهد بود.

نرم افزار Power BI

نرم‌افزار پاور بی آی (Power BI) یکی از بهترین نرم‌افزارهای تحلیل داده و ساخت گزارش‌های مدیریتی می‌باشد. امروزه این نرم‌افزار محبوب‌ترین ابزار طراحی داشبورد مدیریتی و رسم نمودار است. (گزارش های متعدد شرکت گارتنر و سایت های مقایسه و ارزیابی مطرح و نظرات کاربران)
با Power BI تحلیل هر نوع داده ساخت یافته از داده‌های اقتصادی گرفته تا داده‌های شخصی و سازمانی را به خوبی می‌توان انجام داد. مثلاً فرض کنید می‌خواهیم اطلاعات یک یا چند نماد بورسی، داده‌های قیمت مسکن، نرخ ارز، آب و هوا و یا فروش یا منابع انسانی یک شرکت را تحلیل کنیم. این کارها به راحتی و به شکل جذابی با نرم‌افزار پاور بی آی قابل انجام است.
پاور بی ای ویژگی های مثبت زیادی دارد اما رایگان بودن، مایکروسافتی بودن و همچنین نظم در به روز رسانی‌ آن را از سایر رقبایش جدا کرده است.

اجزاء Power BI

نرم افزار Power BI دارای ۴ نرم‌افزار داخلی برای انجام کل فرایند تحلیل داده می‌باشد. اولین بخش آن پاورکوئری (Power Query) نام دارد که وظیفه آن پاکسازی و تغییر شکل داده‌ها (Transformation) می‌باشد. این نرم‌افزار انقلابی در حوزه تغییر شکل و پاکسازی داده می باشد.

بخش دوم این نرم‌افزار مدل سازی (Data Modeling) است که در آن جداول و ارتباطات بین آنها (Relationship) مشخص می‌شوند تا بتوان یک گزارش جامع از داده‌ها و جداول مختلف گرفت.

در بخش سوم مصورسازی را داریم که با تعداد حدود ۳۰۰ نمودار و قابلیت‌های مصورسازی دیگر به ما کمک می‌کند تا به بهترین شکل داده‌ها را به نمودار تبدیل کنیم. قابلیت هایی مانند Tooltip و Drilldown و Drillthrough و …

اجزاء معرفی شده تا اینجا ابزارهای بسیار خوبی بوده اند و کمک می‌کنند تا به خوبی فرایند تبدیل داده به اطلاعات (تحلیل داده) را طی کنیم اما قطعا در هنگام کار با نمودارها به نواقص و محدودیت‌هایی برخورد خواهیم کرد. به عنوان مثال نمودارهای رایج قابلیت نمایش تجمعی یا نرخ رشد را ندارند. برای رفع این محدودیت‌ها و محاسبات بهتر و پیچیده‌تر از فرمول نویسی DAX استفاده می‌ شود. نرم‌افزار Power BI با این چهار بخش قدرتمند می‌شود که می‌توانید داده‌های خود را در این برنامه به نمودار و تحلیل‌های حرفه‌ای تبدیل کنید.

زمان لازم برای یادگیری Power BI

برای یادگیری نرم‌افزار Power BI یک بازه زمانی ۴ الی ۵ ماهه نیاز است که مقدار دقیق این زمان به رشته، شغل و سن هر فرد بستگی دارد.

زبان SQL

اگر به دنیای تحلیل داده وارد شوید حتما به زودی با یک دیتابیس SQL Server یا Oracle روبرو خواهید شد. در این دیتابیس ها زبان پرس و جوی SQL حاکم است و برای کند و کاو جداول و داده ها و ستون ها باید به این زبان آشنایی کافی داشته باشید.

به عنوان مثال برای پیدا کردن جداول و ستون های مورد نظر برای وارد کردن آن ها به ابزار هایی مانند Power BI احتمالا شما با چالش روبرو خواهید شد چرا که با این دیتابیس و ساختار و دیاگرام آن آشنایی ندارید. در بسیاری از موارد شرکت سازنده نرم افزار که این دیتابیس را طراحی کرده است هم دیاگرام یا مستندات مناسبی برای پیدا کردن ساختار های آن ندارد یا آن را در اختیار شما قرار نمی دهد.

ما بطور مشخص برای شما یکسری دستورات ضروری و کاربردی زبان SQL را به همراه نکات کلیدی برای پیداکردن جداول و اطلاعات این پایگاه داده در یک دوره تحت عنوان دستورات کاربردی زبان SQL برای شما آماده کرده ایم.

دوره‎های پیشنهادی مرتبط با زبان SQL

زبان Python

با ابزارهایی نظیر Excel و Power BI شما می توانید صرفا داده های ثبت شده را بصورت گذشته نگر تحلیل کنید و روی آن ها تحلیل های آماری و توصیفی و تشخیصی داشته باشید. دروصورتی که بخواهید پیش بینی انجام دهید ابزارهای یادشده قابلیت های کافی برای این منظور ندارند. حال چه باید کرد؟

یکی از بهترین و کاملترین و ساده ترین زبان های برنامه نویسی در این خصوص زبان Python است که به دلیل داشتن پکیج های رایگان و امکانات فراوان محبوبترین زبان تحلیل داده و یادگیری ماشین در حال حاضر به شمار می رود.

اهمیت یادگیری این زبان برنامه نویسی به قدری است که از سال ۲۰۲۳ مایکروسافت قابلیت های تحلیل داده این زبان را به نرم افزار اکسل ۳۶۵ اضافه کرده است و این ویژگی مهم به مرور به تمام اکسل های فعال دنیا اضافه خواهد شد.

حداقل چیزی که علاوه بر زبان Python در دوره تحلیل داده با پایتون یاد خواهید گرفت مفاهیم آماری و نحوه استفاده از آن ها در این زبان، انواع نمودارهای کاربردی و EDA (Exploratory Data Analysis) و الگوریتم های پایه ای یادگیری ماشین به جهت پیش بینی و تحلیل های پیشرفته روی داده ها می باشد.

قابلیت های مهم زبان پایتون برای تحلیل داده

زبان پایتون دارای پکیج های متعدد و رایگان بسیار کامل و حرفه ای برای تحلیل داده می باشد. در این قسمت به فهرستی خلاصه از این قابلیت ها و پکیج ها اشاره می شود:

پکیج Matplotlib برای رسم نمودار

پکیج Seaborn برای رسم نمودار

پکیج Pandas برای کار با داده ها

پکیج Numpy برای کار با ماتریس ها و جداول

پکیج Scikit-learn برای یادگیری ماشین

زمان یادگیری Python

برای یادگیری مباحث ارائه شده در دوره تحلیل داده با پایتون باید حداقل ۳ ماه زمان صرف کنید و با یادگیری هر درس حتما در داده های رایگانی که در بستر وب وجود دارد برای خود مثال های تمرینی ایجاد کنید و تحلیل ها و پیش بینی های مختلفی انجام دهید.

دوره‎های پیشنهادی مرتبط با تحلیل داده پیشرفته

عضویت
به دوستتان خبر دهید.
guest
0 نظر
Inline Feedbacks
View all comments