Деректер сапасы дегеніміз не
Деректердің дәлдігі мен толықтығын қамтамасыз ету
Деректер сапасы дегеніміз не
Деректер сапасы — бизнес-процестер мен талдауда пайдалануға жарамдылығын анықтайтын деректер сипаттамаларының жиынтығы.
Сапа өлшемдері
| Өлшем | Сипаттама | |-------|-----------| | Дәлдік | Нақты әлеммен сәйкестік | | Толықтық | Толтыру деңгейі | | Келісімділік | Жүйелер арасындағы келісімділік | | Уақыттылық | Жаңалық және уақыттылық | | Жарамдылық | Бизнес ережелеріне сәйкестік | | Бірегейлік | Қайталанбау |
Тексеру түрлері
- Схема валидациясы — құрылымды тексеру
- Диапазон тексерулері — рұқсат етілген шектердегі мәндер
- Үлгі сәйкестігі — формат сәйкестігі
- Сілтемелік тұтастық — қатынастар тұтастығы
- Бизнес ережелері — бизнес логика
Құралдар
| Құрал | Түрі | |-------|------| | Great Expectations | Python framework | | dbt tests | SQL негізінде | | Apache Griffin | Ашық бастапқы код | | Talend DQ | Кәсіпорын | | Soda Core | Заманауи DQ |
Сапа көрсеткіштері
- Деректер сапасы балы (DQS)
- Өріс бойынша қате деңгейі
- Толықтық пайызы
- Жаңалық (соңғы жаңартудан бері уақыт)
Енгізу тәжірибелері
- Кіріс кезінде деректерді профильдеу
- Pipeline-дағы автоматты тексерулер
- Сапа төмендеуі кезінде ескерту
- Data stewardship процестері
- Деректер сөздігі құжаттамасы