
واژهنامه داده و تحلیل
همزمان با ورود حوزههای جدید علم و فناوری به یک کشور، مجموعهی گستردهای از عبارت و اصطلاحات جدید هم با آن وارد میشود. متخصصان این حوزههای نو نیز با دلایل و انگیزههای گوناگون، گاه عامدانه و گاه ناخودآگاه، تشریح و معادلسازی واژگان جدید ناآشنا را شروع میکنند.
در حوزه داده و تحلیل، سالهاست که در ایران اصطلاحات و واژگان آماری در بین تحلیلگران و آمارگران به صورت استاندارد جاری است، ولی واژگان مباحث تحلیلیِ جدید که مبتنی بر شیوههای نوین رایانهای هستند، مانند “یادگیری ماشین” و “یادگیری عمیق” به تازگی متداول شدهاند. ازاینرو امروزه با حجمی از واژههای نو و کهنه طرف هستیم که یا همه با معادل فارسی و معانی آن آشنا نیستند، یا عبارات معادل فارسی ندارند و یا اجماعی دربارهی برگردان فارسی آنها وجود ندارد.
واژهنامهی حاضر به منظور ایجاد یک رویه یکسان و مرجع در معادلسازی واژگان حوزه داده و تحلیل، ترجمه و تنظیم گردیده است و امیدواریم برای مدیران سازمانها، متخصصان و علاقهمندان این حوزه و هر کسی که بهنوعی با این حوزه سروکار دارد، مفید واقع شود.
A
Activity Feed/Stream
جریان/خوراک فعالیت
فهرستی از آخرین اطلاعات در مورد افراد و گروههایی که کاربر در یک سیستم آنها را دنبال میکند و به ترتیب زمانی (از جدید به قدیم) مرتب شده است. خوراکهای فعالیت اغلب برای نمایش آخرین فعالیتها درون یک فروم یا در کل یک شبکه اجتماعی سازمانی به کار میروند.
Advanced Statistical Methods
روشهای پیشرفته آماری
روشهای آماری (مانند تحلیل پیشبینیکننده یا تحلیل خوشهبندی) که از روشهای مرسوم و آمار توصیفی (تحلیل بسامد) پیشرفتهتر هستند.
Algorithms
الگوریتمها
روشهای ریاضیاتی که برای تحلیل داده به کار میروند.
Analytics
تحلیل
فرایند جستجو و استخراج بینشِ معنادار از داده و استفاده از آن بینش برای بهبود تصمیمها.
Autotagging/Autoclassification
برچسبگذاری خودکار / طبقهبندی خودکار
ابزارهایی که بهصورت خودکار و بر اساس منبع یا اطلاعاتِ درون یک محتوای مشخص، برای آن فراداده (متادیتا) تولید میکنند.
B
Big Data
کلانداده
حجم انبوهی از داده که از منابع متعدد (دادههای عملکردی سازمان، تعاملات شبکههای اجتماعی و …) جمعآوریشدهاند. تحلیل و درک کلانداده معمولاً، به روشهای آماری و ابزارهای تحلیلی پیشرفته نیاز دارد. جمعآوری، ذخیره، جستجو، به اشتراکگذاری، تحلیل و درک کلانداده، فراتر از توانِ ابزارها و پایگاهدادههای مرسوم است.
Blockchain
بلاکچین
به زبان ساده، بلاک چین یک نوع سیستم ثبت اطلاعات و گزارش است. تفاوت آن با سیستمهای دیگر این است که اطلاعات ذخیرهشده روی این نوع سیستم، میان همه اعضای یک شبکه به اشتراک گذاشته میشود. با استفاده از رمزنگاری و توزیع دادهها، امکان هک، حذف و دستکاری اطلاعات ثبتشده، تقریباً از بین میرود.
Business Analytics
تحلیل کسبوکار
بهکارگیری بینش استخراجشده از دادهها و پایگاههای داده برای تصمیمگیری و طراحی اقدام.
تحلیل کسبوکار از آمار توصیفی و روشهای آماری پیشرفته برای شناسایی و درک عوامل مؤثر در موفقیت کسبوکار و پیشبینی روندها و عواملی که در آینده کسبوکار را تحت تأثیر قرار میدهند، استفاده میکند.
Business Intelligence
هوش تجاری
بهصورت کلی به معنای شناسایی، استخراج و تحلیل دادههای کسبوکار برای جهتدادن به تصمیمها یا پشتیبانی از آنها است.
C
Cloud
اَبر
«ابر» در زمینه رایانش، به معنی گردآوری، مدیریت و به اشتراکگذاری منابع پردازشی (شامل فضای ذخیرهسازی و توان پردازشی) است به گونهای که کاربران قادر باشند حسب نیاز، با کمترین زحمت، در کوتاهترین زمان، و به میزان کافی، منابع پردازشی لازم برای اهداف خود را در اختیار بگیرند.
Cluster Analysis
تحلیل خوشه
تحلیل خوشه یا خوشهبندی به روشهایی برای کشف گروههای (خوشههای) مشابه از دادگان گفته میشود. از جمله روشهای رایج برای تحلیل خوشه میتوان به خوشهبندی دادگان با کمترین فاصله، خوشهبندی دادگان پُر چگال، و همچنین خوشهبندی دادگان بر اساس توزیعهای آماری اشاره کرد.
برای مثال فرض کنید شما سازمان بزرگی هستید که مشتریان متعددی دارد، هر یک از مشتریان شما برای خرید از شما رفتار خاصی دارند، با تحلیل خوشهای میتوان مشتریان شما را باتوجهبه رفتار خریدشان در چند گروه دستهبندی کرد. بدین ترتیب هر گروه شامل مشتریانی خواهد بود که رفتار مشابهی با یکدیگر دارند.
Cognitive Computing
رایانش شناختی
دانش و فناوری برای طراحی سامانههای پردازشی هوشمند با تقلید از فرآیندهای فکری و رفتاری انسان است. به بیان دیگر، هدف رایانش شناختی، مطالعه و طراحی برای ایجاد مدلهای جدید رایانش با هدف بازتولید رفتار انسانی در زمینه استنتاج، یادگیری، برنامهریزی، و تصمیمگیری است.
Competitive Analytics
تحلیل رقابتی
مجموعه روشها برای گردآوری و تحلیل داده از رقبا و فضای بازار در یک حوزه کسبوکار برای شناسایی و ارزیابی نقاط قوت ضعف، استراتژیها و اقدامات رقبا.
Continuous Variable
متغیر پیوسته
متغیر پیوسته متغیری است که بین دو واحد آن هر نقطه یا مقداری را میتوان انتخاب کرد. در این متغیر درجات مختلف اندازهگیری وجود دارد و دقت وسیله اندازهگیری، تعداد این درجات را تعیین میکند. بهعنوانمثال، وزن یک متغیر پیوسته است و میتواند بین صفر تا بینهایت باشد. وزن یک شخص میتواند ۵۵ یا ۵۶ کیلوگرم باشد و یا میتواند هر عددی بین این دو عدد باشد (مثلاً 55.6 یا 55.64 کیلوگرم). قد، زمان، طول یا ارتفاع پرش، درصد چاقی بدن، و سطح هموگلوبین خون متغیرهای پیوسته هستند.
Correlation Analysis
تحلیل همبستگی
مجموعه روشهای آماری/احتمالاتی برای تعیین میزان همبستگی/وابستگی دو متغیر با هم است. در آمار و احتمالات، یک متغیر را همبسته با متغیر دیگر گویند، اگر تغییرات مقدار یک متغیر، بر روی مقدار متغیر دیگر اثر قابل توجه و غیر قابل اغماض داشته باشد.
Cross-Channel Analytics
تحلیل بین کانالی
شناسایی کانالها یا مسیرهای تعامل با مشتری، با استفاده از روشهای آماری پیشرفته، که منجر به بهبود رفتار مشتریان (مثلاً تبدیل وضعیت آنها از بازدیدکننده به شناسایی کانالها یا مسیرهای تعاملِ موفق با مشتری، با استفاده از روشهای آماری پیشرفته که منجر به بهبود رفتار مشتریان (مثلاً تبدیل وضعیت آنها از بازدیدکننده به خریدار) میشود.
تحلیل بینکانالی عموماً شامل تعیین کانالهای موفق در میان کانالهای تعامل با مشتری و یا تحلیل مسیر یک مشتری معین میپردازد.
Cross-tabulation
جدولبندی متقاطع
یک روش تحقیق کمّی که برای تحلیل رابطه بین دو یا چند متغیر استفاده میشود.
Customer Analytics
تحلیل مشتری
تحلیل رفتار مشتریان بهمنظور درک و پیشبینی عادات خرید، ارزش چرخه عمر و اولویتهای سبک زندگی مشتری، با استفاده از روشهای آماری پیشرفته
D
Dark Data
داده سیاه
دادههایی که سازمانها از فعالیتها و فرایندهای کاری خود جمعآوری، پردازش و ذخیرهسازی میکنند ولی از آن برای مقاصد تحلیلی استفاده نمیشود؛ اینگونه دادهها صرفاً به دلیل الزامات قانونی و تطبیق جمعآوری میشوند.
Dashboard
داشبورد
بازنمایی گرافیکی دادههای استاتیک یا بلادرنگ (معمولاً در سطوح بالای سازمان) برای پایش وضعیت یا سطح عملکرد سازمان. داشبوردها خلاصهای از اطلاعات برای بهبود تصمیمگیری ارائه میدهند.
Data Governance
حاکمیت داده
حاکمیت داده درواقع بیانگر افراد، فرایندهای کسبوکار و فناوریهای موردنیازی است که برای مدیریت و محافظت از داراییهای دادهای سازمان به کار میروند. درواقع حاکمیت داده تضمین میکند که دادههای سازمان قابلدرک، درست، کامل، قابلاعتماد، امن و قابلدسترسی و استفاده باشند.
Data Integration
یکپارچهسازی داده
فرآیند پیش پردازش دادههای ورودی از منابع متعدد و ناهمگون است، به گونهای که یک نمای یکپارچه از دادهها فراهم شده و تحلیلهای تکمیلی تسهیل شود.
Data Integrity
درستی داده
به معنای میزان درستی و قابل اعتماد بودن یک مجموعه داده است. این میزان با ترکیبی از میزان «دقت»، «کامل بودن» و «به هنگام بودن» داده سنجیده میشود.
Data Lake
دریاچه داده
یک مخزن ذخیره داده که دادهها را در قالب یک نمای پالایش نشده در اختیار تحلیلگران داده قرار میدهد.
Data Management
مدیریت داده
اصطلاحی کلی که به مدیریت کل چرخه حیات داده در یک سازمان اشاره دارد و شامل حاکمیت داده، یکپارچگی و درستی دادهها، و انبارش داده میشود.
Data Mining
دادهکاوی
فرآیند استخراج و کشف دانش از مجموعه دادهگان بزرگ است که از روشهای گوناگون در حوزه ذخیرهوبازیابی اطلاعات، تحلیل آماری، و یادگیری ماشین بهرهگیری میشود.
Data Point (Datum)
نقطه داده
به هر عنصر منفرد و قابلشناسایی در یک مجموعه داده گفته میشود.
Data Science
علم داده
استفاده از ابزارهای کوئری، تحلیل و گزارشدهی بهمنظور استخراج و بازنمایی اطلاعات و استنتاج از روی دادهها.
Data Set
مجموعه داده
مجموعهای از نقاط داده.
Data Validation
اعتبارسنجی داده
فرایندی که در آن دادهها باهدف شناسایی و احتمالاً اصلاح یا حذف دادههای مشکلدار پردازش میشوند.
Data Warehouse
انبار داده
انبار داده مخزنی از دادههایی است که از یک یا چند سیستم تراکنشمحور با هدف تسهیل پردازشهای تحلیلی و تجمیعی جمعآوری شده است.
Deep Learning
یادگیری عمیق
روشهایی از یادگیری ماشینی بر پایه استفاده از شبکههای عصبی عمیق که از دادههای موجود برای محاسبه رفتارها و خروجیهای آینده استفاده میکند.
Demographic Data
دادهٔ جمعیتشناختی (دموگرافیک)
دادههایی که ویژگیهای یک جمعیت را توصیف میکند. سن، جنسیت، محل تولد، سطح تحصیلات، میزان درآمد و … دادههای جمعیت شناختی هستند.
Descriptive Statistics
آمار توصیفی
آمار توصیفی یا تحلیل توصیفی از ترکیب هوش تجاری و دادههای موجود استفاده میکند تا تصویری از آنچه که در کسبوکار در حال رخدادن است به دست بدهد. در آمار توصیفی از روشهای معمول آماری مانند میانگین، میانه، مد، توزیع فراوانی نقاط گسسته داده و رتبه درصدی استفاده میشود.
Digitization
دیجیتالی سازی
به مجموعه اقداماتی اطلاق میشود که برای دیجیتالی کردن فرایندها، سیستمها و اطلاعات و قراردادن آنها در قالبی که برای کامپیوترها و ابزارهای الکترونیکی قابلفهم باشد انجام میشود.
Discrete Variable
متغیر گسسته
متغیری شمارا است که مقادیر ممکن بین هر دو مقدار دلخواه آن، متناهی باشد. متغیر گسسته میتواند یک عدد یا یک ارزش مشخصکننده یک وجه مشخص و معین از یک مقیاس باشد .
E
Experimental Design
طرح آزمایش
برنامهای دقیق که نحوه اجرای یک آزمایش برای آزمون یک فرضیه را ترسیم میکند.
Exploratory Data Analysis
تحلیل اکتشافی داده
به روشهایی برای بررسی دادهها گفته میشود که در آن از مدلسازی و استنتاجهای مرسوم آماری استفاده نشود. معمولاً در چنین تحلیلهایی از بصریسازی دادهها استفاده میشود.
External Data
دادهٔ خارجی
دادههایی که از منابع بیرون از سیستمهای یک سازمان جمعآوری میشود.
F
Firmographic Data
داده بنگاه شناختی/ شرکت شناختی
دادههایی که مشخصههای سازمانها را توصیف میکند. اطلاعاتی هستند که ویژگیهای بنگاهها (یعنی شرکتها) را توصیف میکنند. این خصوصیات میتواند شامل اندازه شرکت، صنعت، وضعیت قانونی، درآمد و طول چرخه فروش باشد.
G
Gap Analysis
تحلیل شکاف
تکنیکی برای شناسایی میزان انحراف موجود بین اهداف و عملکرد فعلی بهمنظور تعیین اقدامات بعدی برای حرکت از وضعیت فعلی به وضعیت مطلوب.
Graph/Relational Database
پایگاه داده گراف
پایگاه دادهای که برای گرفتنِ کوئریهای معنایی از ساختارهای مبتنی بر گراف و از گرهها، یالها و مشخصههای آنها برای ذخیره و بازیابی داده استفاده میکند. پایگاههای داده مبتنی بر گراف، برای ناویدن (Navigate) ارتباطات و اتصالات بین دادهها مناسب هستند.
H
Hierarchical Clustering
خوشهبندی سلسلهمراتبی
خوشهبندی سلسله مراتبی، الگوریتمی است که سلسله مراتب خوشهها را میسازد. هر سطح از سلسلهمراتب یک دستهبندی از دادهها را نمایش میدهد که میتوان به آن به شکل یک درخت نگاه کرد. هر کدام از برگهای درخت نشان دهنده یک مشاهده اولیه میباشند و ریشه درخت مجموعهٔ تمام مشاهدات است. نتایج خوشهبندی سلسلهمراتبی معمولا به شکل یک دندروگرام نمایش داده میشود.
Hypothesis
فرضیه
فرضیه، به فرضی گفته میشود که به عنوان یک توضیح قابل آزمایش مطرح میشود و پایهٔ تحقیقات بعدی را تشکیل میدهد. در علوم داده فرضیه یک گزاره ممکن درباره مسأله است که توسط تحلیلگر مطرح و به آزمایش گذاشته میشود. فرضیه میتواند تأیید یا رد شود.
I
Indexing
نمایهسازی
سازماندهی داده یا محتوا به شکلی ساختیافته تا بتوان بهراحتی آن را برچسبگذاری، مدیریت و بازیابی کرد.
Information Management
مدیریت اطلاعات
فرایندها و ابزارهایی که اطلاعات را از منابع مختلف کسب میکنند و در اختیار کسانی قرار میدهند که به آن نیاز دارند. مدیریت اطلاعات شامل سازماندهی، بررسی، آرشیو، گزارشدهی، و کنترل دسترسی به اطلاعات میشود.
Intelligent Systems
سیستمهای هوشمند
سامانههای پیشرفته از نظر فناوری که میتوانند محیطِ اطراف خود را بهگونهای درک کرده و به آن پاسخ دهند.
Internal Data
دادهٔ داخلی
دادههایی که از منابع درون سیستمهای یک سازمان جمعآوری شده است.
Internet of Things (IoT)
اینترنت اشیاء
شبکهای از اشیاء فیزیکی که تجهیزات الکترونیکی، سنسور، نرمافزار و امکانات ارتباطی در آن تعبیه شده است تا امکان تبادل داده با دیگر سیستمها و ابزارهای متصلبههم را فراهم کند.
Internet of Everything (IoE)
اینترنت همهچیز
راهکارهایی که افراد، فرایندها و دادهها را در کنار هم قرار میدهد تا ارتباطات شبکهای بین آنها امکانپذیر شود.
تفاوت «اینترنت همه چیز» با «اینترنت اشیا» این است که علاوه بر ارتباط بین اشیاء یا دستگاهها، ارتباطات بین افراد و ماشینها و افراد با افراد بهواسطه ابزارهای فناوری را نیز شامل میشود.
K
Key Performance Indicator (KPI)
شاخص کلیدی عملکرد
شاخصهای سطح بالایی که برای اندازهگیری بخشهای قابل کمّیسازی عملکرد سازمان استفاده میشوند. شاخصهای کلیدی عملکرد از نظر استراتژیک حائز اهمیت هستند، از اهداف عملیاتی منتج میشوند و اصولاً برای اندازهگیری میزان تأثیر روی ذینفعان کلیدی (مثلاً سهامداران، مشتریان، و کارکنان) به کار میروند. شاخصهای کلیدی معمولاً به اهداف کسبوکار و عوامل حیاتی موفقیت سازمان مرتبط هستند. هر شاخص کلیدی نماینده تعدادی شاخص است که برای اندازهگیری و پایش عملکرد استفاده میشوند.
Knowledge Analytics
تحلیل دانش
یک روششناسی برای اندازهگیری، تحلیل، گزارشدهی و پشتیبانی از تصمیم است/ در این روش دادههای مرتبط با رویکردهای مدیریت دانش و همچنین فرایندهای کسبوکار ترکیب میشود تا در زمینه برنامهریزیهای مرتبط با دانش سازمانی کمک کند. تحلیل دانش، آمار مربوط به مدیریت دانشِ سازمان را با دادههایی از منابع انسانی، مدیریت محتوا، تحلیل شبکههای اجتماعی، مالی، بازاریابی، عملیات و دیگر بخشها ترکیب میکند تا الگوهای مهم در خلق، به اشتراکگذاری و استفاده از دانش را در میان کارکنان شناسایی کند.
L
Labeled Data
داده برچسبزدهشده
یک مجموعه داده است که در آن یک برچسب، طبقهبندی یا تگ معنادار به هر کدام از ستونهای داده اطلاق شده است. به طور مثال برچسب یک مجموعه تصویر میتواند این باشد که عکسی از گربه یا سگ است.
M
Machine Learning
یادگیری ماشین
قابلیت یک سیستم کامپیوتری در یادگیری و بهبود بر اساس تجربه بدون اینکه به طور مستقیم در آن زمینه برای آن برنامه ای نوشته شده باشد. یادگیری ماشینی معمولاً شامل بررسی و استفاده از الگوریتمهایی است که به دنبال کشف الگوها و آزمون فرضیهها روی مجموعهدادههای بزرگ است تا سیستم یاد بگیرد کدام اقدام یا کدام مشخصه در صورت وقوع یک الگوی خاص درست است. چهار نوع یادگیری ماشینی وجود دارد: یادگیری تحت نظارت، یادگیری نیمهنظارتی، یادگیری بدون نظارت و یادگیری تقویتی
Measure
معیار
برشی از سطح عملکردی یک فرایند که بررسی و اندازهگیری میشود.
Metadata
فراداده
اطلاعاتِ ساختیافته در موردِ دادهها که باعث میشود داده مورد نظر راحتتر پیدا، استفاده و مدیریت شوند. به فراداده، «داده در مورد داده» نیز گفته میشود. به واژه تاکسونومی / آرایهبندی نیز مراجعه کنید.
Metric
سنجه
معیارهای اندازهگیری فعالیتها و عملکرد سازمانی.
N
Natural Language Processing (NLP)
پردازش زبان طبیعی
مجموعه روشها و فرآیندهای پردازش و تحلیل متن و گفتار به زبان انسانی توسط سامانههای رایانهای است که هدف آن استخراج دانش یا کشف الگو از متن یا گفتار است. یک موتورِ NLP میتواند یک نوشته را بهعنوان ورودی دریافت کند و مشخص کند متن تا چه حدی به چه موضوعی مرتبط است. مثلاً تشخیص دهد ۷۰% متن در مورد موضوع الف است.
Neural Network
شبکه عصبی
مجموعهای از مدلهای محاسباتی در شاخه یادگیری ماشین است که ایده اصلی آنها از ساختار و کارکرد مغز و دستگاه عصبی انسان (و یا سایر موجودات زنده) الهام گرفته شده است. شبکههای عصبی از شبکهای از گرههای محاسباتی متصل به هم تشکیل شده که خروجی برخی گرهها به عنوان ورودی گرههای دیگر استفاده میشود.
Normalize
نرمالسازی
تبدیل مقادیر اندازهگیری شده در مقیاسهای متفاوت به یک مقیاس مشترک و قابلمقایسه.
O
Operational Definition
تعریف عملیاتی
توضیح دقیق و با جزئیات از چگونگی تعریف یک واژه یا اصطلاح توسط یک فرد یا گروه. تعاریف عملیاتی برای بهبود تعامل و یکسانسازی ارتباط بین افراد، تیمها و واحدها استفاده میشود.
Organizational Performance Management
مدیریت عملکرد سازمانی
مجموعهای از فعالیتهای مستمر برای تعیین اهداف سازمانی، پایش پیشرفت در اهداف و اعمال تغییرات برای دستیابی به اهداف به شکل مؤثرتر و با راندمان بیشتر.
P
Predictive Analytics
تحلیلهای پیشبینانه
استفاده از روشهای آماری، یادگیری ماشین، یادگیری عمیق و دادهکاوری برای پیشبینی رویدادها یا روندهای آینده بر اساس یک یا چند مجموعهداده. در این نوع تحلیل، مدلهای آماری برای تخمین «آنچه ممکن است اتفاق بیفتد» استفاده میشود.
Prescriptive Analytics
تحلیلهای تجویزی
در این نوع تحلیل از قوانین تصمیمگیری یا بهینهسازی برای تعیین «آنچه باید در شرایط معینی انجام شود» استفاده میشود. این نوع تحلیل را میتوان پیشرفتهترین نوع تحلیل دانست زیرا از بینش حاصل از تحلیل پیشبینانه برای پیشنهاد تصمیمات یا اقدامات با پیامدهای مشخص و باتوجهبه اهداف و ورودیهای مشخص استفاده میشود.
Process Automation
خودکارسازی فرایند
استفاده از نرمافزار برای تقلید اقدامات انسان و اتصال سیستمهای مجزا از طریق خودکارسازی (اتوماسیون). خودکارسازی فرایند، سیستمها را قادر میسازد فعالیتهای چندمرحلهای در حجم بالا را بدون دخالت دستی کارکنان انجام دهند و در سیستمهای دیگر اطلاعات را ذخیره کنند، دادهها را تغییر دهند یا رویدادهای جدیدی را کلید بزنند.
Process Mining
فرایند کاوی
مجموعهای از تکنیکها که امکان تحلیل فرایندها را بر اساس لاگ رویدادهای فرایند فراهم میکند. در این روش با استفاده از الگوریتمهای دادهکاوی، الگوها و روندهایی شناسایی میشوند که از آن برای نگاشت فرایند یا شناسایی فرصتهای بهبود در فرایند استفاده میشود.
R
Robotic Process Automation (RPA)
خودکارسازی رباتیک فرایند
گونهای از خودکارسازی فرایند که مراحل فرایند را با مدلهای تصمیمگیری یا قوانین کسبوکار بدون دخالت انسان ترکیب میکند. این روش معمولاً روی فرایندهایی با حجم تراکنش بالا، با تنوع محدود و قوانین کسبوکار و مدلهای تصمیم شفاف قابلاجراست.
Regression Analysis
تحلیل رگرسیون
مجموعهای از روشهای تحلیل آماری است که برای تخمین رابطه میان یک متغیر وابسته با یک یا چند متغیر مستقل استفاده میشود. از جمله کاربردهای رایج برای این روش تحلیل، پیشبینی روند مقادیر است
Risk Analytics
تحلیل ریسک
تعیین میزان ریسک مرتبط با یک پروژه، تصمیم یا اقدام، روی یک یا چند مجموعهداده، با استفاده از روشهای آماری پیشرفته.
Root Cause Analysis
تحلیل علل ریشهای
مجموعه اقداماتی که برای تعیین دلایل ریشهای یک رخداد انجام میشود.
Robotic Desktop Automation
اتوماسیون رباتیک دسکتاپ
نوعی از اتوماسیون فرایند که در زمان اجرا در نقاط تصمیمگیری متوقف شده تا بر اساس قضاوت و یا ورودی انسانی ادامه یابد. این نوع اتوماسیون معمولاً در مورد فرایندهایی به کار میرود که یا تنوع زیادی در اجرا دارند یا به ورودیهای پویا نیاز دارند.
S
Scalability
مقیاسپذیری
قابلیت توسعهپذیری یا رشد یک سیستم، پروژه یا فرایند.
Sentiment Analysis
تحلیل احساسات
تحلیل دادههای متنی غیر ساختیافته، با استفاده از روشهای آماری پیشرفته، برای تعیین اینکه یک فرد یا گروه در مورد یک مفهوم مانند محصول یا سازمان چه حسی دارد.
Social Network Analysis
تحلیل شبکه اجتماعی
مجموعه روشهای مبتنی بر نظریات گراف و علوم شبکه برای تحلیل ارتباطات میان اعضای شبکههای اجتماعی است. هدف این تحلیل پیشبینی کنشها، گروهها و دستهبندیها، و ارتباطات نهان یا آتی است.
Software as a Service (SaaS)
نرمافزار بهعنوان یک خدمت
مدلی از ارائه نرمافزار که ارائهدهنده میزبانی نرمافزار را بر عهده میگیرد و امکان استفاده از آن را به کاربران روی اینترنت میدهد. مشتریان، نرمافزار را بهصورت اشتراک خریداری میکنند. SaaS نوعی از رایانش ابری است.
Speech Recognition
تشخیص گفتار/بازشناسی گفتار
مجموعه روشهای مبتنی بر پردازش سیگنال و یادگیری ماشین که امکان بازشناسی گفتار انسانی و تبدیل آن به داده نوشتاری را فراهم میسازد..
Statistical Model
مدل آماری
مدلهای ریاضیاتی هستند که با در نظر گرفتن برخی فرضیات، روش بازتولید و توزیع مقادیر دادهگان را بیان میکند. مدلهای آماری بنیان استنتاجهای آماری هستند.
Statistical Significance
معناداری آماری
آستانهای که بیش از آن یک رابطه آماری معتبر و معنادار شناخته میشود.
Structured Data
داده ساختارمند
دادههایی که به شکلی مرتب شده باشند که کامپیوتر بتواند آن را بازیابی، پردازش و در آن تغییر اعمال کند. دادههای موجود در نرمافزارهای صفحات گسترده (اسپریدشیت) مثل اکسل و پایگاههای داده رابطهای از این نوع هستند.
Supervised Machine Learning
یادگیری ماشین نظارت شده
آن دسته از الگوریتمهای یادگیری ماشین که از مشاهده و تحلیل نمونههای آموزشی متعدد برای کشف و استنتاج رابطه نگاشت ورودی به خروجی استفاده میکنند. نمونههای آموزشی برچسبگذاری شده یا جفتهای ورودی-خروجی معلوم به این الگوریتمها ارائه میشود و پس از مرحله یادگیری، مدل استنتاج شده برای بهرهبرداری آماده است. به طور معمول، هرچه تعداد نمونههای آموزشی بیشتر باشد کارآیی این الگوریتمها و کیفیت مدل استنتاج شده بهتر خواهد بود.
Supporting Performance Indicator
شاخص عملکرد پشتیبان
شاخصهایی هستند که علاوه بر شاخصهای کلیدی عملکرد، برای مدیریت و بهبود کسبوکار استفاده میشوند. شاخصهای عملکرد پشتیبان امکان کندوکاو اطلاعات مرتبط با فرایندها را فراهم میکند تا سازمان بتواند علل ریشهای شکافهای عملکردی را پیدا کند.
Systems Thinking
تفکر سیستمی
شیوهای تحلیلی که روی روابط بین اجزاء یک سیستم و همچنین ارتباط بین سیستم با سیستمهای بزرگتر متمرکز است.
T
Taxonomy
تاکسونومی/آرایهبندی
شکلی از فراداده که نقش «زبان مشترک» را بازی میکند. تکسونومی شامل سلسلهمراتبی از دستههاست که از دستههای عمومی به دستههای خاصتر شکسته میشود و برای طبقهبندی محتوا استفاده میشود. در یک سازمان، تکسونومی برای طبقهبندی محتوای سازمانی بهمنظور یکسانسازی دسترسی به محتوا در بخشها و در زمینههای مختلف به کار میرود.
Text Analytics
تحلیل نوشتار
استفاده از روشهای آماری برای تحلیل متنهای غیرساختیافته و استخراج ساختارهای اطلاعاتی کاربردی و هوشمندانه.
U
Unstructured Content
محتوای بدون ساختار
محتوایی که فاقد قالب یا دستهبندیِ لازم برای تفسیر و به کار گرفته شدن توسط کامپیوترها باشد. مصادیق این نوع محتوا عبارتاند از گزارش، فایلهای ارائه، ایمیل، طراحی و نقشه، ویدئو و نوشتههای شبکه اجتماعی. وقتی از مدیریت محتوا صحبت میکنیم، محتوای غیرساختیافته یعنی محتوایی که فاقد متادیتا باشد، بهاینترتیب سیستمها نمیتوانند بهخوبی آن را تحلیل کرده و در اختیار کاربر قرار دهند.
Unstructured Data
دادهی بدون ساختار
دادههایی که در یک قالب از پیش تعریف شده، سازماندهی نشدهاند. جستجو در اطلاعات غیر ساختیافته مشکل است.
Unsupervised Machine Learning
یادگیری ماشین بدون نظارت
یک سیستم یا الگوریتم یادگیری ماشین که از دادهها جهت استخراج راهحل برای متغیرهای پنهان در دادهها استفاده میکند. چنین الگوریتمهایی میتوانند بهصورت خودکار، دستهبندیها و ساختارها را کشف کنند. یادگیری بدون نظارت زمانی به کار گرفته میشود که دادههای ورودی دارید ولی هیچ متغیر خروجی مرتبط با آن وجود ندارد. به عبارتی الگوریتم بدون هیچگونه راهنمایی در مورد جواب درست باید به دنبال الگوهایی در دادهها بگردد. هدف یادگیری بدون نظارت مدلسازی ساختار درونی یا توزیع دادههاست تا بتواند بیشتر در مورد دادهها یاد بگیرد.
V
Value Proposition
ارزش پیشنهادی
توصیفِ دلایلِ یک اقدام بهبود یا تغییر که بر اساس تخمینِ هزینهها، منافع و ریسکهای آن باشد. در زمان تهیه ارزش پیشنهادی، باید ارزش را هم برای سازمان (چه مشکلی از سازمان برطرف میشود؟)، هم برای کارکنان (چه منافعی برای کارکنان دارد؟) تعریف کرد.
Variable
متغیر
هر عدد، کمیت یا مشخصه قابلاندازهگیری.
Virtual Reality
واقعیت مجازی
یک تجربه دیداری-شنیداری شبیهسازی شده توسط سامانههای رایانهای است. در سازمانها، از واقعیت مجازی میتوان برای آموزش، نمونهسازی و مدلسازی استفاده کرد.
Visual Analytics
تحلیل بصری
استفاده از رابطهای کاربری بصری برای تحلیل دادهها.
W
Workforce Analytics
تحلیل نیروی کار
استفاده از آمار توصیفی و روشهای پیشرفته آماری برای تحلیل و پیشبینی اتفاقات مرتبط با نیروی کار در سازمان.
Social Media Analytics
تحلیل رسانههای اجتماعی
تحلیل رفتارهای پیشین مخاطبان و پیشبینی رفتارهای آتی آنها، با استفاده از روشهای آماری پیشرفته روی دادههای جمعآوری شده از رسانههای اجتماعی.