واژه‌نامه داده و تحلیل

هم‌زمان با ورود حوزه‌های جدید علم و فناوری به یک کشور، مجموعه‌ی گسترده‌ای از عبارت و اصطلاحات جدید هم با آن وارد می‌شود. متخصصان این حوزه‌های نو نیز با دلایل و انگیزه‌های گوناگون، گاه عامدانه و گاه ناخودآگاه، تشریح و معادل‌سازی واژگان جدید ناآشنا را شروع می‌کنند.

در حوزه داده و تحلیل، سال‌هاست که در ایران اصطلاحات و واژگان آماری در بین تحلیل‌گران و آمارگران به صورت استاندارد جاری است، ولی واژگان مباحث تحلیلیِ جدید که مبتنی بر شیوه‌های نوین رایانه‌ای هستند، مانند “یادگیری ماشین” و “یادگیری عمیق” به تازگی متداول شده‌اند. ازاین‌رو امروزه با حجمی از واژه‌های نو و کهنه طرف هستیم که یا همه با معادل فارسی و معانی آن آشنا نیستند، یا عبارات معادل فارسی ندارند و یا اجماعی درباره‌ی برگردان فارسی آن‌ها وجود ندارد.

واژه‌نامه‌ی حاضر به منظور ایجاد یک رویه یکسان و مرجع در معادل‌سازی واژگان حوزه داده و تحلیل، ترجمه و تنظیم گردیده است و امیدواریم برای مدیران سازمان‌ها، متخصصان و علاقه‌مندان این حوزه و هر کسی که به‌نوعی با این حوزه سروکار دارد، مفید واقع شود.

A
B
C
D
E
F
G
I
K
M
N
O
P
R
S
T
U
V
W

A

Activity Feed/Stream


جریان/خوراک فعالیت

یک لیست از آخرین اطلاعات در مورد افراد و گروه‌هایی که یک کاربرد در یک سامانه آن‌ها را دنبال می‌کند و به ترتیب زمانی (از جدید به قدیم) مرتب شده است. خوراک‌های فعالیت اغلب برای نمایش آخرین فعالیت‌ها درون یک فروم یا در کل یک شبکه اجتماعی سازمانی به کار می‌روند.

Advanced Statistical Methods


روند پیشرفته آماری

تکنیک‌های آماری (مانند تحلیل پیش بینی یا تحلیل خوشه‌بندی) که از روش‌های مرسوم و آمار توصیفی (تحیلی بسامد) پیشرفته‌تر هستند.

Algorithms


فرمول‌های ریاضیاتی که برای تحلیل داده به کار می‌روند.

Analytics


علم تحلیل

فرآیند جستجو و استخراج بینشِ معنادار از داده و استفاده از آن بینش برای بهبود تصمیم‌ها.

Autotagging/Autoclassification


برچسب‌گذاری خودکار / طبقه‌بندی خودکار

ابزارهایی که به صورت اتوماتیک و بر اساس منبع یا اطلاعاتِ درون یک محتوای مشخص، برای آن فراداده (متا دیتا) تولید می‌کنند.

B

Big Data


کلان‌داده یا داده‌های حجیم

مجموعه‌های بسیار بزرگی از داده‌ها که از منابع متعدد (داده‌های عملکردی سازمان، تعاملات شبکه‌های اجتماعی) جمع‌آوری شده‌اند. تحلیل و درک کلان‌داده معمولاً، به روش‌های آماری و ابزارهای تحلیلی پیشرفته نیاز دارد. جمع‌آوری، ذخیره، جستجو، به اشتراک‌گذاری، تحلیل و درک کلان‌داده، فراتر از توانِ ابزارها و پایگاه‌داده‌های مرسوم است.

Blockchain


زنجیره بلوکی

گونه‌ خاصی از دفتر کل (حسابداری) که به صورت یک ساختار توزیع شده بین افراد مختلف نگهداری می‌شود و ایجاد شبکه‌های تجاری را برای ردیابی و دادوستد هر نوع کالای دارای ارزش تسهیل می‌کند بدون این‌که نیاز به کنترل مرکزی داشته باشد.

Business Analytics


علم تحلیل کسب‌وکار

به کارگیری دانش استخراج‌شده از داده‌ها و پایگاه‌های داده برای تصمیم‌گیری و طراحی اقدام.

علم تحلیل کسب‌وکار از آمار توصیفی و روش‌های آماری پیشرفته برای شناسایی و درک عوامل موثر در موفقیت کسب‌وکار و پیش‌بینی روندها و عواملی که در آینده کسب‌وکار را تحت تاثیر قرار می‌دهند، استفاده می‌ند.

Business Intelligence


هوش تجاری

به‌صورت کلی به معنای شناسایی، استخراج و تحلیل داده‌های کسب‌وکار برای جهت دادن به تصمیم‌ها یا پشتیبانی از آن‌ها است.

C

Cloud


ابر

ارائه امکانات و ظرفیت محاسباتی به‌صورت خدمت روی بستر اینترنت. عبارت ابر به‌صورت مفهومی به هر فضایی اطلاق می‌شود که میزبانی از داده‌ها، برنامه‌های کاربردی و یا خدمات را خارج از مرزهای سازمان و روی اینترنت بر عهده داشته باشد.

در اصل فضای ابری مجموعه‌ای از کامپیوترهای به هم متصل است که طراحی شده‌اند تا به‌عنوان یک اکوسیستم واحد فعالیت کنند. فضاهای ابری ایجاد شده‌اند تا یک یا چند سرویس مختلف را (اعم از فضای ذخیره‌سازی، ارسال و دریافت داده و امکان استفاده از نرم‌افزارهای مختلف) عرضه کنند، تا کاربرانی مثل ما و شما بتوانند از راه دور از این سرویس‌ها استفاده نمایند.

Cluster Analysis


تحلیل خوشه

یک روش آماری پیشرفته که با استفاده از الگوریتم‌ها، اشیای مشابه را در یک گروه دسته‌بندی می‌کند، به هر یک از این گروه‌ها، یک خوشه گفته می‌شود.

برای مثال فرض کنید شما سازمان بزرگی هسید که مشتریان متعددی دارد، هر یک از مشتریان شما برای خرید از شما رفتار خاصی دارد، با تحلیل خوشه‌ای می‌توان مشتریان شما را با توجه به رفتار خریدشان در چند گروه دسته‌بندی کرد. بدین ترتیب هر گروه شامل مشتریانی خواهد بود که رفتار مشابهی با یکدیگر دارند.

Cognitive Computing


پردازش شناختی

سیستم‌های کامپیوتریِ خود یادگیرنده که از داده‌کاوی و یادگیری ماشینی برای شبیه‌سازی فرایندهای فکری انسان استفاده می‌کنند.

Competitive Analytics


تحلیل رقابتی

شناسایی و ارزیابی استراتژی‌ها و اقدامات رقبا و مقایسه آن‌ها با سازمان خود، با استفاده از روش‌های آماری پیشرفته.

Continuous Variable


متغیر پیوسته

متغیر پیوسته متغیری است که بین دو واحد آن هر نقطه یا ارزشی را می‌توان انتخاب کرد. در این متغیر درجات مختلف اندازه‌گیری وجود دارد و دقت وسیله اندازه‌گیری، تعداد این درجات را تعیین می‌کند. به‌عنوان‌مثال، وزن یک متغیر پیوسته است و می‌تواند بین صفر تا بی‌نهایت باشد. وزن یک شخص می‌تواند 55 یا 56 کیلوگرم باشد و یا می‌تواند هر عددی بین این دو عدد باشد (مثلاً 55.6 یا 55.64 کیلوگرم). قد، زمان، طول یا ارتفاع پرش، درصد چاقی بدن، و سطح هموگلوبین خون متغیرهای پیوسته هستند.

Correlation Analysis


تحلیل همبستگی

یک تکنیک آماری برای تعیین میزان وابستگی دو متغیر به هم.

Cross-Channel Analytics


تحلیل بین کانالی

شناسایی کانال‌ها یا مسیرهای تعامل با مشتری، با استفاده از روش‌های آماری پیشرفته، که منجر به بهبود رفتار مشتریان (مثلاً تبدیل وضعیت آن‌ها از بازدیدکننده به خریدار) می‌شود.

تحلیل بین‌کانالی معمولاً یا به بررسی مسیرهایی می‌پردازد که بین کانال‌های تعامل با مشتری موفق‌تر هستند یا به تحلیل مسیر یک مشتری معین.

Cross-tabulation


جدول‌بندی متقاطع

یک روش تحقیق کمّی که برای تحلیل رابطه بین دو یا چند متغیر استفاده می‌شود.

Customer Analytics


تحلیل مشتری

تحلیل رفتار مشتریان به‌منظور درک و پیش‌بینی عادات خرید، ارزش چرخه عمر، و اولویت‌های سبک زندگیِ مشتری، با استفاده از روش‌های آماری پیشرفته

D

Dark Data


داده‌ی سیاه

داده‌هایی که سازمان‌ها از فعالیت‌ها و فرایندهای کاری خود جمع‌آوری، پردازش و ذخیره‌سازی می‌کنند ولی از آن برای مقاصد تحلیلی استفاده نمی‌شود؛ این‌گونه داده‌ها صرفاً به دلیل الزامات قانونی و تطبیق جمع‌آوری می‌شوند.

Dashboard


داده‌ی سیاه

بازنمایی گرافیکی داده‌های استاتیک یا بلادرنگ (معمولاً در سطوح بالای سازمان) برای پایش وضعیت یا سطح عملکرد سازمان. داشبوردها خلاصه‌ای از اطلاعات برای بهبود تصمیم‌گیری ارائه می‌دهند.

Data Governance


حاکمیت داده

حاکمیت داده درواقع بیانگر افراد، فرآیندهای کسب‌وکار و فناوری‌های موردنیازی است که برای مدیریت و محافظت از دارایی‌های داده سازمان به‌کار می‌روند. درواقع حاکمیت داده تضمین می‌کند که داده‌های سازمان قابل‌درک، درست، کامل، قابل‌اعتماد، امن و قابل‌دسترسی و استفاده باشند.

Data Integration


یکپارچه‌سازی داده

فرایند ترکیب داده از منابع ناهمگون به شکلی به‌سادگی قابل‌مشاهده و تحلیل باشد.

Data Integrity


صحت‌وسقم داده

ترکیبی از میزان دقت، کامل بودن، به‌موقع بودن و اعتبار یک دیتاسِت.

Data Lake


دریاچه داده

یک مخزن ذخیره داده که داده‌ها را در قالب یک نمای پالایش نشده در اختیار تحلیلگران داده قرار می‌دهد.

Data Management


مدیریت داده

اصطلاحی کلی که به مدیریت کل چرخه حیات داده در یک سازمان اشاره دارد و شامل حاکمیت داده، یکپارچگی و درستی داده‌ها، و انبارش داده می‌‌شود.

Data Mining


داده‌کاوی

به‌کارگیری روش‌های هوشمند در کشف دانش جدید، جالب و قابل‌توجه در دیتاسِت‌های بزرگ. این دانش می‌تواند در قالب الگوها، ارتباط‌ها، تغییرات یا ناهنجاری‌ها خود را نشان دهد. به‌بیان‌دیگر فرایندی است برای تحلیل داده‌ها (جستجوی الگوها یا روابط سیستماتیک بین متغیرها) و خلاصه‌سازی آن در قالب اطلاعات کاربردی.

Data Point (Datum)


نقطه داده

به هر عنصر منفرد و قابل شناسایی در یک دیتاسِت گفته می‌شود. داده توسط سیستم‌ها پردازش می‌شود، می‌تواند یا مستقیماً تولید شود (مثل مستردیتا) یا غیرمستقیم (مثل رکورد تراکنش‌هایی که به‌عنوان خروجی جانبی اجرای فرایندها تولید می‌شود.)

Data Science


علم داده

استفاده از ابزارهای کوئری، تحلیل و گزارش‌دهی به‌منظور استخراج و بازنمایی اطلاعات و استنتاج کردن از روی داده‌ها.

Data Set


مجموعه داده

مجموعه‌ای از نقاط داده‌ای.

Data Validation


اعتبارسنجی داده

فرایندی که در آن داده‌ها با هدف شناسایی و احتمالاً اصلاح یا حذف داده‌های مشکل‌دار پردازش می‌شوند.

Data Warehouse


انبار داده

انباره داده مخزنی از داده‌هایی است که از یک یا چند سیستم تراکنش محور جمع‌آوری شده است.

Data Learning


یادگیری عمیق

روش‌هایی از یادگیری ماشینی بر پایه استفاده از مدل‌های پیش‌بینی که از داده‌های موجود برای محاسبه رفتارها و خروجی‌های آینده استفاده می‌کند.

Demographic Data


داده‌ی جمعیت شناختی (دموگرافیک)

داده‌هایی که مشخصه‌های یک جمعیت را توصیف می‌کند.

Descriptive Statistics


آمار توصیفی

تنظیم و طبقه‌بندی داده‌ها، نمایش ترسیمی، و محاسبه‌ی مقادیری از قبیل نما، میانگین، میانه و … می‌باشد که حاکی از مشخصات یکایک اعضای جامعه‌ی مورد بحث است. در آمار توصیفی اطلاعات حاصل از یک گروه، همان گروه را توصیف می‌کند و اطلاعات به دست آمده به دسته‌جات مشابه تعمیم داده نمی‌شود.

Digitization


دیجیتالی سازی

به مجموعه اقداماتی اطلاق می‌شود که برای آنلاین کردنِ فرایندها، سامانه‌ها و اطلاعات و همچنین قراردادن آن‌ها در قالبی که برای کامپیوترها و ابزارهای الکترونیکی قابل‌فهم باشد انجام می‌شود.

Discrete Variable


متغیر گسسته

متغیری است که مقادیر احتمالی آن بی‌نهایت نیست. متغیر گسسته می‌تواند اعداد یا ارزش‌هایی را که مشخص‌کننده یک وجه مشخص و معین از یک مقیاس هستند، به خود اختصاص دهد

E

Experimental Design


طرح آزمایش

برنامه‌ای دقیق که نحوه اجرای یک آزمایش برای آزمون یک فرضیه را ترسیم می‌کند.

Exploratory Data Analysis


تحلیل اکتشافی داده

به روش‌هایی برای بررسی داده‌ها گفته می‌شود که در آن از مدل‌سازی و استنتاج‌های مرسوم آماری استفاده نشود. معمولاً در چنین تحلیل‌هایی از بصری‌سازی داده‌ها استفاده می‌شود.

External Data


داده‌ی خارجی

داده‌هایی که از منابع بیرون از سیستم‌های یک سازمان جمع‌آوری می‌شود.

F

Firmographic Data


داده‌ی بنگاه شناختی/ شرکت شناختی

داده‌هایی که مشخصه‌های سازمان‌ها را توصیف می‌کند. اطلاعاتی هستند که ویژگی‌های بنگاه‌ها (یعنی شرکت‌ها) را توصیف می‌کنند. این خصوصیات می‌تواند شامل اندازه شرکت، صنعت، وضعیت قانونی، درآمد و طول چرخه فروش باشد.

G

Gap Analysis


تحلیل شکاف

تکنیکی برای شناسایی میزان انحراف موجود بین اهداف و عملکرد فعلی به‌منظور تعیین اقدامات بعدی برای حرکت از وضعیت فعلی به وضعیت مطلوب.

Graph/Relational Database


پایگاه داده رابطه‌ای/گراف

پایگاه داده‌ای که برای گرفتنِ کوئری‌های معنایی از ساختارهای مبتنی بر گراف و از گِرِه‌‌ها، یال‌‌ها و مشخصه‌های آن‌ها برای ذخیره و بازیابی داده استفاده می‌کند. پایگاه‌‌های داده مبتنی بر گراف، برای پویشِ ارتباطات و اتصالات بین داده‌ها مناسب هستند.

I

Indexing


نمایه‌سازی

سازمان‌دهی داده یا محتوا به شکلی ساخت‌یافته تا بتوان به‌راحتی آن را تَگ‌ گذاری، مدیریت و بازیابی کرد.

Information Management


مدیریت اطلاعات

فرایندها و ابزارهایی که اطلاعات را از منابع مختلف کسب می‌کنند و در اختیار کسانی قرار می‌دهند که به آن نیاز دارند. مدیریت اطلاعات شامل سازمان‌دهی، بررسی، آرشیو، گزارش‌‌دهی، و کنترل دسترسی به اطلاعات می‌شود.

Intelligent Systems


سیستم‌های هوشمند

سامانه‌های پیشرفته از نظر فناوری که می‌تواند محیطِ اطراف خود را به‌گونه‌ای درک کرده و به آن پاسخ دهد.

Internal Data


داده‌ی داخلی

داده‌هایی که از منابع درون سیستم‌های یک سازمان جمع‌آوری شده است.

Internet of Things (IoT)


اینترنت اشیاء

شبکه‌ای از اشیاء فیزیکی که تجهیزات الکترونیکی، سنسور، نرم‌افزار و امکانات ارتباطی در آن تعبیه شده است تا امکان تبادل داده با دیگر سیستم‌ها و ابزارهای متصل‌به‌هم را فراهم کند.

Internet of Everything (IoE)


اینترنت همه‌چیز

راهکارهایی که افراد، فرایندها و داده‌ها را در کنار هم قرار می‌دهد تا ارتباطات شبکه‌ای بین آن‌ها امکان‌پذیر شود.

تفاوت «اینترنت همه‌چیز» با «اینترنت اشیا» این است که علاوه بر ارتباط بین اشیاء یا دستگاه‌ها، ارتباطات بین افراد و ماشین‌ها و افراد با افراد به‌واسطه ابزارهای فناوری را نیز شامل می‌شود

K

Key Performance Indicator (KPI)


شاخص کلیدی عملکرد

شاخص‌های سطح بالایی که برای اندازه‌گیری بخش‌های قابل کمی سازی از عملکرد سازمان استفاده می‌شوند. شاخص‌های کلیدی عملکرد از نظر استراتژیک حائز اهمیت هستند، از اهداف عملیاتی منتج می‌شوند و اصولاً برای اندازه‌گیری میزان تأثیر روی ذینفعان کلیدی (مثلاً سهامداران، مشتریان، و کارکنان) به کار می‌روند. شاخص‌های کلیدی معمولاً به اهداف کسب‌وکار و عوامل حیاتی موفقیت سازمان مرتبط هستند. هر شاخص کلیدی نماینده تعدادی شاخص است که برای اندازه‌گیری و پایش عملکرد استفاده می‌شوند.

Knowledge Analytics


علم تحلیل دانش

یک متدلوژی برای اندازه‌گیری، تحلیل، گزارش دهی و پشتیبانی از تصمیم که داده‌های مرتبط با رویکردهای مدیریت دانش و همچنین فرایندهای کسب‌وکار را ترکیب کرده تا در زمینه برنامه‌ریزی‌های مرتبط با دانش سازمانی کمک کند. علم تحلیل دانش، آمار مربوط به مدیریت دانشِ سازمان را با داده‌هایی از منابع انسانی، مدیریت محتوا، تحلیل‌های شبکه اجتماعی، مالی، بازاریابی، عملیات و دیگر بخش‌ها ترکیب کرده تا الگوهای مهم در خلق، به اشتراک‌گذاری و استفاده از دانش را در میان کارکنان شناسایی کند.

M

Machine Learning


یادگیری ماشین

قابلیت یک سیستم کامپیوتری در یادگیری و بهبود بر اساس تجربه بدون این‌که به‌طور مستقیم در آن زمینه برای آن برنامه‌ای نوشته شده باشد. یادگیری ماشینی معمولاً شامل بررسی و استفاده از الگوریتم‌هایی است که به دنبال کشف الگوها و آزمون فرضیه‌ها روی مجموعه داده‌های بزرگ است تا سیستم یاد بگیرد کدام اقدام یا کدام مشخصه در صورت وقوع یک الگوی خاص درست است. یادگیری در این سیستم با انجام تعداد زیادی آزمون در قالب الگوریتم‌های اگر‌آنگاه اتفاق می‌افتد. دو مدل یادگیری ماشینی وجود دارد: یادگیری تحت نظارت و یادگیری بدون نظارت.

Measure


سنجه

برشی از سطح عملکردی یک فرایند که بررسی و اندازه‌گیری می‌شود.

Metadata


فراداده

اطلاعاتِ ساخت‌یا‌فته در موردِ منابع اطلاعاتی که باعث می‌شود این منابع راحت‌تر پیدا شده، استفاده شده و مدیریت شوند. معمولاً به آن «داده در مورد داده» نیز گفته می‌شود. به واژه Taxonomy نیز مراجعه کنید.

Metric


شاخص

معیارهای اندازه‌گیری فعالیت‌ها و عملکرد سازمانی.

N

Natural Language Processing (NLP)


پردازش زبان طبیعی

نرم‌افزار یادگیری ماشینی که به کامپیوترها کمک می‌کند زبان انسان را درک کنند و الگوهایی را در آن تشخیص دهند. یک موتورِ NLP می‌تواند یک نوشته را به‌عنوان ورودی دریافت کند و مشخص کنند متن تا چه حدی به چه موضوعی مرتبط است. (مثلاً 70% متن در مورد موضوع الف است.)

Neural Network


شبکه عصبی

یک سامانه کامپیوتری که بر اساس مغز و شبکه عصبی انسان مدل شده است و از مجموعه‌ای از گِرِه‌های متصل‌به‌هم برای یادگیری فعالیت‌ها استفاده می‌کند.

Normalize


نرمال‌سازی

تبدیل مقادیر اندازه‌گیری شده در مقیاس‌های متفاوت به یک مقیاس مشترک و قابل‌مقایسه.

O

Operational Definition


تعریف عملیاتی

توضیح دقیق و با جزئیات از چگونگی تعریف یک واژه یا اصطلاح توسط یک فرد یا گروه. تعاریف عملیاتی برای بهبود تعامل و یکسان‌سازی ارتباط بین افراد، تیم‌ها و واحدها استفاده می‌شود.

Organizational Performance Management


مدیریت عملکرد سازمانی

مجموعه‌ای از فعالیت‌های مستمر برای تعیین اهداف سازمانی، پایش پیشرفت در اهداف و اعمال تغییرات برای دستیابی به اهداف به شکل مؤثرتر و با راندمان بیشتر.

P

Predictive Analytics


تحلیل‌های پیش‌بینانه

استفاده از روش‌های آماری و الگوریتم‌های متنوع برای پیش‌بینی رویدادها یا روندهای آینده بر اساس یک یا چند مجموعه داده. در این نوع تحلیل، مدل‌های آماری برای تخمین «آنچه ممکن است اتفاق بیفتد» استفاده می‌شود.

Prescriptive Analytics


تحلیل‌های تجویزی

در این نوع تحلیل از قوانین تصمیم‌گیری یا بهینه‌سازی برای تعیین «آنچه باید در شرایط معینی انجام گردد» استفاده می‌شود. این نوع تحلیل را می‌توان پیشرفته‌ترین نوع تحلیل دانست زیرا از بینش حاصل از تحلیل پیش‌بینانه برای پیشنهاد تصمیمات یا اقدامات با پیامدهای مشخص و با توجه به اهداف و ورودی‌های مشخص استفاده می‌شود.

Process Automation


اتوماسیون فرایند

استفاده از نرم‌افزار برای تقلید اقدامات انسان و اتصال سیستم‌های مجزا از طریق اتوماسیون. اتوماسیون فرایند، سیستم‌ها را قادر می‌سازد فعالیت‌های چندمرحله‌ای در حجم بالا را بدون دخالت دستی کارکنان انجام داده در سیستم‌های دیگر اطلاعات را ذخیره کند، داده‌ها را تغییر دهد یا رویدادهای جدیدی را کلید بزند.

Process Mining


فرایند کاوی

مجموعه‌ای از تکنیک‌ها که امکان تحلیل فرایندها را بر اساس لاگ رویدادهای فرایند فراهم می‌کند. در این روش با استفاده از الگوریتم‌های داده‌کاوی، الگوها و روندهایی شناسایی می‌شوند که از آن برای نگاشت فرایند یا شناسایی فرصت‌های بهبود در فرایند استفاده می‌شود.

R

Robotic Process Automation (RPA)


اتوماسیون رباتیک فرایند

گونه‌ای از اتوماسیون فرایند که مراحل فرایند را با مدل‌های تصمیم‌گیری یا قوانین کسب‌وکار بدون دخالت انسان ترکیب می‌کند. این روش معمولاً روی فرایندهایی با حجم تراکنش بالا، با تنوع محدود و قوانین کسب‌وکار و مدل‌های تصمیم شفاف قابل اجراست.

Regression Analysis


تحلیل رگرسیون

یک شیوه آماری که برای بررسی وابستگی یا هم‌بستگی یک متغیر وابسته با یک یا چند متغیر مستقل استفاده می‌شود.

Risk Analytics


تحلیل ریسک

تعیین میزان ریسک مرتبط با یک پروژه، تصمیم یا اقدام، روی یک یا چند مجموعه داده، با استفاده از روش‌های آماری پیشرفته.

Root Cause Analysis


تحلیل ریشه – علت

مجموعه اقداماتی که برای تعیین دلایل ریشه‌ای یک رخداد انجام می‌شود.

Robotic Desktop Automation


اتوماسیون رباتیک دسکتاپ

نوعی از اتوماسیون فرایند که در زمان اجرا در نقاط تصمیم‌گیری متوقف شده تا بر اساس قضاوت و یا ورودی انسانی ادامه یابد. این نوع اتوماسیون معمولاً در مورد فرایندهایی به کار می‌رود که یا تنوع زیادی در اجرا دارند یا به ورودی‌های پویا نیاز دارند.

S

Scalability


مقیاس‌پذیری

قابلیت توسعه‌پذیری یا رشد یک سیستم، پروژه یا فرایند.

Sentiment Analysis


تحلیل احساسات

تحلیل داده‌های متنی غیر ساخت‌یافته، با استفاده از روش‌های آماری پیشرفته، برای تعیین این‌که یک فرد یا گروه در مورد یک مفهوم مانند محصول یا سازمان چه حسی دارد.

Social Media Analytics


تحلیل رسانه‌های اجتماعی

تحلیل رفتارهای پیشین مخاطبان و پیش‌بینی رفتارهای آتی آن‌ها، با استفاده از روش‌های آماری پیشرفته روی‌داده‌های جمع‌آوری شده از رسانه‌های اجتماعی.

Social Network Analysis


تحلیل شبکه اجتماعی

تکنیکی که با استفاده از تئوری شبکه، روابط بین افراد و گروه‌ها را در یک شبکه اجتماعی تحلیل و بصری سازی می‌کند.

Software as a Service (SaaS)


نرم‌افزار به‌عنوان یک خدمت

مدلی از ارائه نرم‌افزار که ارائه‌دهنده میزبانی نرم‌افزار را بر عهده می‌گیرد و امکان استفاده از آن را به کاربران روی اینترنت می‌دهد. مشتریان، نرم‌افزار را به‌صورت اشتراک خریداری می‌کنند. SaaS نوعی از رایانش ابری است.

Software as a Service (SaaS)


نرم‌افزار به‌عنوان یک خدمت

مدلی از ارائه نرم‌افزار که ارائه‌دهنده میزبانی نرم‌افزار را بر عهده می‌گیرد و امکان استفاده از آن را به کاربران روی اینترنت می‌دهد. مشتریان، نرم‌افزار را به‌صورت اشتراک خریداری می‌کنند. SaaS نوعی از رایانش ابری است.

Speech Recognition


تشخیص گفتار

نرم‌افزاری که امکان شناسایی گفتار انسان و تبدیل آن به نوشتار را فراهم می‌کند.

Statistical Model


مدل آماری

یک توزیع احتمال روی فرضیه‌ها و داده‌های جمع‌آوری شده. مدل‌های آماری برای استنتاج و تصمیم‌گیری استفاده می‌شوند.

Statistical Significance


معناداری آماری

آستانه‌ای که بیش از آن یک رابطه آماری معتبر و معنادار شناخته می‌شود.

Structured Data


داده‌های ساخت‌یافته

داده‌هایی که به شکلی مرتب شده باشند که کامپیوتر بتواند آن را بازیابی، پردازش و در آن تغییر اعمال کند. نمونه‌هایی از آن داده‌های موجود در صفحات گسترده و پایگاه‌های داده رابطه‌ای است.

Supervised Machine Learning


یادگیری ماشین با نظارت

سیستم یا الگوریتم یادگیری ماشینی که از داده‌ها برای استخراج راه‌حل از متغیرهای خروجی مشخص استفاده می‌کند. زمانی به یادگیری ماشین با سرپرستی اطلاق می‌شود که شما متغیر ورودی X و متغیر خروجی Y را داشته باشید و بخواهید سیستم تابع نگاشت ورودی به خروجی را یاد بگیرد (Y=f(x. به این دلیل به آن یادگیری ماشینی با نظارت اطلاق می‌گردد که جواب‌های درست در مجموعه داده‌های آموزشِ الگوریتم وجود دارد. دو نوع یادگیری ماشینی با نظارت وجود دارد:

  1. دسته‌بندی: زمانی که هدف الگوریتم دسته‌بندی موارد موجود در داده‌ها به دسته‌های خاص باشد.
  2. رگرسیون: زمانی که هدف الگوریتم پیش‌بینی یک متغیر پیوسته مانند هزینه یا زمان باشد.

Supporting Performance Indicator


شاخص عملکرد پشتیبان

شاخص‌هایی هستند که علاوه بر شاخص‌های کلیدی عملکرد، برای مدیریت و بهبود کسب‌وکار استفاده می‌شوند. شاخص‌های عملکرد پشتیبان امکان کندوکاو اطلاعات مرتبط با فرایندها را فراهم می‌کند تا سازمان بتواند علل ریشه‌ای شکاف‌های عملکردی را پیدا کند.

Systems Thinking


تفکر سیستمی

شیوه‌ای تحلیلی که روی روابط بین اجزاء یک سیستم و همچنین ارتباط بین سیستم با سیستم‌های بزرگ‌تر متمرکز است.

T

Taxonomy


طبقه‌بندی

شکلی از فراداده که نقش «زبان مشترک» را بازی می‌کند. تکسونومی شامل سلسله مراتبی از دسته‌هاست که از دسته‌های عمومی به دسته‌های خاص‌تر شکسته می‌شود و برای طبقه‌بندی محتوا استفاده می‌شود. در یک سازمان، تکسونومی برای طبقه‌بندی محتوای سازمانی به‌منظور یکسان‌سازی دسترسی به محتوا در بخش‌ها و در زمینه‌های مختلف به کار می‌رود.

Text Analytics


تحلیل متن

استفاده از روش‌های آماری برای تحلیل محتوای غیر ساخت‌یافته و استخراج ساختارهای اطلاعاتی کاربردی و هوشمندانه.

U

Unstructured Content


محتوای غیر ساخت‌یافته

محتوایی که فاقد قالب یا دسته‌بندیِ لازم برای تفسیر و به کارگرفته شدن توسط کامپیوترها باشد. مصادیق این نوع محتوا عبارت‌اند از گزارش، فایل‌های ارائه، ایمیل، طراحی و نقشه، ویدئو و نوشته‌های شبکه اجتماعی. وقتی از مدیریت محتوا صحبت می‌کنیم، محتوای غیر ساخت‌یافته یعنی محتوایی که فاقد متادیتا باشد، به‌این‌ترتیب سامانه‌ها نمی‌توانند به‌خوبی آن را تحلیل کرده و در اختیار کاربر قرار دهند.

Unstructured Data


داده‌ی غیر ساخت‌یافته

داده‌ها‌‌‌یی که در یک قالب از پیش تعریف شده، سازمان‌دهی نشده‌‌اند. جستجو در اطلاعات غیر ساخت‌یافته مشکل است.

Unsupervised Machine Learning


یادگیری ماشین بدون نظارت

یک سامانه یا الگوریتم یادگیری ماشینی که از داده‌‌ها جهت استخراج راه‌حل برای متغیرهای پنهان در داده‌ها استفاده می‌کند. چنین الگوریتم‌هایی می‌توانند به‌صورت خودکار، دسته‌‌بندی‌ها و ساختارها را کشف کنند. یادگیری بدون نظارت زمانی به‌کار گرفته می‌شود که داده‌های ورودی دارید ولی هیچ متغیر خروجی مرتبط با آن وجود ندارد. به عبارتی الگوریتم بدون هیچ‌گونه راهنمایی در مورد جواب درست باید به دنبال الگوهایی در داده‌ها بگردد. هدف یادگیری بدون نظارت مدل‌سازی ساختار درونی یا توزیع داده‌هاست تا بتواند بیشتر در مورد داده‌ها یاد بگیرد. دو دسته کلی برای یادگیری بدون نظارت وجود دارد:

  1. خوشه‌بندی: که در آن از الگوریتم‌ها برای پیدا کردن گروه‌های پنهان در داده‌ها استفاده می‌شود مانند بخش‌بندی بازار یا رفتارهای خرید.
  2. وابستگی: که در آن از الگوریتم‌ها برای کشف قوانین در داده‌ها استفاده می‌شود مانند کسانی که X را می‌خرند Y را هم می‌خرند.

V

Value Proposition


پیشنهاد ارزش

توصیفِ دلایلِ یک اقدام بهبود یا تغییر، که بر اساس تخمینِ هزینه‌ها، منافع و ریسک‌های آن باشد. در زمان تهیه پیشنهاد ارزشِ مدیریت دانش، باید ارزش را هم برای سازمان (چه مشکلی از سازمان برطرف می‌شود؟)، هم برای کارکنان (چه منافعی برای کارکنان دارد؟) تعریف کرد.

Variable


متغیر

هر عدد، کمیت یا مشخصه قابل‌اندازه‌گیری.

Virtual Reality


واقعیت مجازی

یک سناریو خلق‌شده با کامپیوتر که تجربیاتِ دنیای واقعی را شبیه‌سازی می‌کند. در سازمان‌ها، از واقعیت مجازی می‌توان برای آموزش، نمونه‌سازی و مدل‌سازی استفاده کرد.

Visual Analytics


تحلیل بصری

استفاده از رابط‌های کاربری بصری برای تحلیل داده‌ها.

W

Workforce Analytics


تحلیل نیروی کار

استفاده از آمار توصیفی و روش‌های پیشرفته آماری برای تحلیل و پیش‌بینی اتفاقات مرتبط با نیروی کار در سازمان.