Unified Pipeline Díl 5: Co bych dnes udělal jinak

# Díl 5: Co bych dnes udělal jinak

## Zkušenost jako filtr

Unified Pipeline nevznikla jako akademický projekt.
Vznikla tlakem reality: času, provozu a odpovědnosti.

S odstupem je ale jasné, že:

– některá rozhodnutí byla správná,
– některá byla nutná,
– a některá byla spíš reakcí na konkrétní situaci než obecně optimálním řešením.

Tento díl není kritikou projektu.
Je pokusem oddělit principy, které přetrvají, od řešení, která byla dobově podmíněná.

## 1. Méně abstrakce na začátku

Jedna z věcí, kterou bych dnes změnil, je tempo abstrakce.

Unified Pipeline byla od začátku navrhována jako:

– obecný rámec,
– použitelný pro více typů modelů,
– s vysokou mírou konfigurovatelnosti.

To přineslo flexibilitu, ale i cenu:

– delší onboarding,
– složitější mentální model,
– a občas nutnost „pochopit systém dřív, než vyřeším problém“.

Dnes bych:

– začal s užším scope,
– nechal abstrakce vznikat až z opakování,
– a část „elegance“ obětoval ve prospěch čitelnosti.

## 2. Ještě tvrdší oddělení experimentu a produkce

Přestože Unified Pipeline jasně rozlišovala mezi experimentem a produkcí, v praxi:

– zůstávaly některé přechody příliš plynulé,
– a experimentální myšlení občas prosakovalo tam, kde už nemělo být.

Dnes bych:

– experimentální fázi ještě víc izoloval,
– produkční pipeline více „uzamkl“,
– a přechod mezi nimi udělal vědomým rozhodnutím, ne postupnou evolucí.

Ne kvůli kontrole, ale kvůli ochraně obou světů.

## 3. Více investice do interpretace, méně do optimalizace

Unified Pipeline byla velmi dobrá v:

– trénování,
– validaci,
– a porovnávání modelů.

Zpětně vidím, že:

**ještě víc hodnoty by přinesla silnější interpretační vrstva.**

Ne ve smyslu:

*„explainability pro audit“,*

ale ve smyslu:

– jaký typ chování model reprezentuje,
– kdy mu věřit a kdy ne,
– jak číst jeho selhání.

Dnes bych:

**část optimalizační energie přesunul právě sem.**

## 4. Méně implicitní expertízy v designu

Unified Pipeline v sobě nesla hodně:

– doménové znalosti,
– metodických předpokladů,
– a „tichých“ rozhodnutí.

Pro zkušený tým to fungovalo skvěle.
Pro nově příchozí už méně.

Z dnešního pohledu bych:

– víc těchto předpokladů externalizoval,
– víc je pojmenoval,
– a méně spoléhal na to, že „je to přece jasné“.

**Pipeline má být čitelná i bez autora v místnosti.**

## 5. Co bych si vzal do každého dalšího projektu

Navzdory všem výše uvedeným bodům existují principy, které bych dnes použil znovu – beze změny.

– **Čas jako základní osa systému**
– **Stabilita nad maximem**
– **Proces důležitější než jednotlivý model**
– **Pipeline jako nositel kultury, ne jen kódu**
– **Omezení jako nástroj kvality, ne brzda**

Tyto principy se ukázaly jako:

– technologicky agnostické,
– přenositelné,
– a dlouhodobě udržitelné.

## Unified Pipeline jako mezník, ne cíl

Dnes už Unified Pipeline nevnímám jako:

*„hotové řešení“,*
ani jako univerzální blueprint.

Vnímám ji jako:

**mezník v přemýšlení o tom, co znamená dělat data science zodpovědně v čase.**

A právě to je možná její největší hodnota.

## Závěrem

Pokud bych měl celou sérii shrnout do jedné věty, zněla by takto:

> **Produkční data science není o tom, jak chytrý je model,
> ale o tom, jak dobře systém zvládá realitu, ve které model žije.**

Comments

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *