AIMeetup #2: Jak dzięki Data Mining księgujemy automatycznie koszty w Infakt.pl?

25
Jak dzięki Data Mining księgujemy automatycznie koszty w inFakt.pl ? Kraków, 20 października 2016

Transcript of AIMeetup #2: Jak dzięki Data Mining księgujemy automatycznie koszty w Infakt.pl?

Jak dzięki Data Mining księgujemy automatycznie koszty w inFakt.pl ?

Kraków, 20 października 2016

O mnie

Sebastian Bobrowski, CTO, co-founder inFakt.pl

O inFakt

InFakt.pl

• 3 produkty: • program do faktur • program do księgowości • ogólnopolskie Biuro Rachunkowe

• 400 000 użytkowników • 9 lat

Dlaczego AI?

Założenia

Księgowy ma bardzo powtarzalną pracę

Ludzie popełniają błędy

Szybkość księgowania

Założenia

Cele:

przyśpieszyć pracę księgowego

zautomatyzować

zmniejszyć ilość błędów

Założenia

Bazujemy na danych na fakturach (NIP) Mamy kilka mln danych uczących

Machine Learning

4 klasyfikatowy:

Passive Aggressive Perceptron

Stochastic Gradient Descent Naive Bayes for multivariate Bernoulli

Machine Learning

Wyniki:

15% skuteczności 95% poprawności

Memory Base Model

XClassifier

Memory Base Model

Memory Base Model

Wyniki:

55% skuteczności 97,5% poprawności

Memory Base Model Błędy

10% - obie decyzje poprawne

15% błąd Xclassifier

75% błąd księgowego

Czego się nauczyłem?

Czego się nauczyłem

Dobranie cech jest kluczowe

Czego się nauczyłem

Prosta implementacja na początek

Czego się nauczyłem

Szybko na produkcji

Czego się nauczyłem

Ludzie się mylą częściej niż niedoskonały algorytm

Co dalej?

Model globalny - wyniki

Analiza tekstu

Model globalny - wyniki

Analiza PKD

Model globalny - wyniki

Szukanie anomalii (kwot, dat)

Open source

Open Source

infakt.com

Pytania?

Kontakt

Sebastian Bobrowski CTO

e-mail: [email protected] mobile.:+48 508 457 847