POLITECHNIKA WARSZAWSKA - staff.elka.pw.edu.plstaff.elka.pw.edu.pl/~mkamola/Czeczko16.pdfPraca...

1

Rok akademicki 2015/16

POLITECHNIKA WARSZAWSKA

Wydział Elektroniki i Technik Informacyjnych

Instytut Automatyki i Informatyki Stosowanej

Praca dyplomowa magisterska

Konstrukcja i weryfikacja wskaźnika

atrakcyjności inwestycji mieszkaniowych

Autor: inż. Patryk Czeczko

Opiekun pracy: dr inż. Mariusz Kamola

2

Streszczenie

Konstrukcja i weryfikacja wskaźnika atrakcyjności inwestycji mieszkaniowych

Celem niniejszej pracy magisterskie było zapoznanie się z rynkiem mieszkań ze

zwróceniem szczególnej uwagi na m. st. Warszawę, przegląd istniejącej literatury i rozwiązań

dotyczących modelowania cen nieruchomości, określenie i analiza cech wpływających na

atrakcyjność mieszkań, która ma bezpośrednie odzwierciedlenie w ich cenie, a następnie

stworzenie i weryfikacja modelu matematycznego zależności cen mieszkań od

najistotniejszych parametrów je opisujących.

Podczas realizacji pracy udało się zgromadzić, przetworzyć i przeanalizować dane

transakcyjne z ostatnich 2 lat dla ponad 7 tysięcy nieruchomości znajdujących się w 5

dzielnicach Warszawy. Za pomocą regresji hedonicznej wyznaczono model cen

nieruchomości uwzględniający wybrane cechy mieszkań, takie jak metraż, kondygnacja oraz

aspekty związane z ich lokalizacją: odległość od centrum miasta oraz położenie względem

istotnych punktów użyteczności publicznej.

Słowa kluczowe: modelowanie, ceny, nieruchomości, regresja hedoniczna

Abstract

Construction and verification of real estate attractiveness index

The purpose of the thesis was to introduce the real estate market and price modeling

topic, review related literature and solutions, define and analyze attributes determining

apartments’ attractiveness which is reflected in their prices and to form and verify a

property pricing model that uses mentioned characteristics of houses.

Author succeeded to process and analyze data regarding over 7 thousands

transactions that had taken place around 5 districts of Capital City of Warsaw during past 2

years. Using hedonic regression a pricing model has been prepared. Following attributes of

properties and their location have been used: flat area, floor where the apartment is

located, distance from city center and location related to points of interest.

Keywords: modelling, real estate, pricing, hedonic regression

3

1. Wstęp .................................................................................................................................. 5

Rynek mieszkań w Polsce ............................................................................................ 5 1.1.

Sformułowanie problemu ............................................................................................ 7 1.2.

Zagadnienie wyceny nieruchomości .................................................................... 7 1.2.1.

Czynniki wpływające na wartość nieruchomości ................................................. 8 1.2.2.

Cel pracy ...................................................................................................................... 9 1.3.

Zakres pracy ........................................................................................................ 10 1.3.1.

2. Przegląd obecnego stanu wiedzy ...................................................................................... 11

Istniejące opracowania i literatura ............................................................................ 11 2.1.

Publikacje dotyczące rynków zagranicznych ...................................................... 11 2.1.1.

Publikacje dotyczące rynku polskiego ................................................................ 12 2.1.2.

Rozwiązania automatyzujące proces oceny wartości nieruchomości....................... 13 2.2.

Walk Score .......................................................................................................... 14 2.2.1.

Szybko.pl ............................................................................................................. 16 2.2.2.

Podsumowanie przedstawionych opracowań i rozwiązań........................................ 17 2.3.

Wskazanie nieopracowanej strony zagadnienia ................................................ 18 2.3.1.

Doprecyzowanie celu pracy ............................................................................... 19 2.3.2.

3. Analiza zagadnienia ........................................................................................................... 20

Szczegółowy opis sposobu modelowania i wyznaczania cen mieszkań .................... 20 3.1.

Regresja hedoniczna........................................................................................... 20 3.1.1.

AVM – automatyczny model wyceny ................................................................. 22 3.1.2.

Określenie składowych atrakcyjności mieszkania ..................................................... 23 3.2.

Parametryzacja opisu nieruchomości ................................................................ 24 3.2.1.

Lokalizacja nieruchomości .................................................................................. 26 3.2.2.

Ogólny model cen mieszkań ............................................................................... 27 3.2.3.

Założenie niezależności składowych .................................................................. 28 3.2.4.

Wykorzystane źródła danych ..................................................................................... 29 3.3.

Rejestr Cen i Wartości Nieruchomości ............................................................... 29 3.3.1.

Mapy Google ...................................................................................................... 31 3.3.2.

Punkty użyteczności publicznej .......................................................................... 33 3.3.3.

Czynniki opisujące mieszkania a dostępne dane ............................................... 35 3.3.4.

Część techniczna analizy zagadnienia ........................................................................ 35 3.4.

Pozyskiwanie danych .......................................................................................... 36 3.4.1.

4

Agregacja danych ............................................................................................... 37 3.4.2.

Sformułowanie hipotez dotyczących zależności ceny mieszkań od czynników ........ 38 3.5.

Parametry mieszkań ........................................................................................... 38 3.5.1.

Cechy lokalizacji .................................................................................................. 41 3.5.2.

Weryfikacja postawionych hipotez ........................................................................... 44 3.6.

Filtrowanie danych ............................................................................................. 45 3.6.1.

Zależność od numeru piętra ............................................................................... 45 3.6.2.

Zależność od metrażu ......................................................................................... 47 3.6.3.

Zależność od piętra i metrażu ............................................................................ 48 3.6.4.

Zależność od odległości od centrum .................................................................. 49 3.6.5.

Zależność od odległości od POI .......................................................................... 52 3.6.6.

Regresja dla wszystkich mieszkań ...................................................................... 53 3.6.7.

Próba korekty modelu ........................................................................................ 55 3.6.8.

Wnioski z analizy ........................................................................................................ 57 3.7.

4. Podsumowanie .................................................................................................................. 58

Podsumowanie przeprowadzonych prac .................................................................. 58 4.1.

Konkluzje .................................................................................................................... 58 4.2.

Możliwości dalszej analizy tematu ............................................................................ 59 4.3.

5

1. Wstęp

Niniejsza praca dyplomowa porusza zagadnienie wyceny nieruchomości, skupiając się

w szczególności na lokalach użytkowych z rynku pierwotnego w m. st. Warszawie. Począwszy

od zapoznania z rynkiem mieszkań zarówno w całym kraju jak i w stolicy i określenia, co de

facto czyni mieszkanie atrakcyjnym dla potencjalnego nabywcy, poprzez przegląd

istniejących rozwiązań i opracowań dotyczących problemu oraz wyboru metodyk i narzędzi

odpowiednich do analizy zagadnienia, aż do postawienia i uzasadnienia autorskich hipotez

dotyczących zależności pomiędzy wartością nieruchomości a czynnikami wpływającymi na

komfort i jakość życia mieszkańców oraz ich weryfikacji za pomocą aparatu matematycznego

z wykorzystaniem ogólnie dostępnych danych, praca przedstawia znalezienia odpowiedzi na

pytanie, od jakich czynników i w jakim stopniu uzależnione są ceny mieszkań.

Rynek mieszkań w Polsce 1.1.

Ceny mieszkań w Polsce ulegają nieustannym, choć nieznacznym, zmianom. Wszelkie

analizy rynku mieszkań w kraju opierają się na badaniu cen lokali w największych polskich

miastach, którymi są miasta wojewódzkie.

Średnie ceny jednego metra kwadratowego po osiągnięciu szczytu w pierwszym

kwartale 2008 roku spadały do roku 2013, po czym odnotowano kolejny, minimalny wzrost

cen [1]. Jednak po urealnieniu cen z wykorzystaniem poziomu inflacji na przestrzeni

ostatnich lat można wywnioskować, że sięgnęły one obecnie poziomów z roku 2006, gdyż

spadły od 28% do 40%. Dodatkowo, uwzględniając fakt, że realna inflacja jest wyższa niż

indeks CPI (wskaźnik cen towarów i usług konsumpcyjnych, najpopularniejsza miara inflacji)

można stwierdzić, że poziom spadków jest jeszcze większy [1], co zostało przedstawione na

rysunku 1.

6

Rys. 1: Wykres zmian średnich cen mieszkań oraz cen realnych względem CPI na przestrzeni lat. Źródło [1], na

podstawie danych z NBP, GUS i AMRON

Jednak, mimo spadku cen, zauważyć można słabnący ruch na rynku mieszkań. Czas

potrzebny na sprzedaż lokalu zwiększył się trzykrotnie w ciągu ostatnich 8 lat. W 2006 roku

przeciętne mieszkanie znajdowało nabywcę w ciągu niecałych 2 miesięcy od wystawienia

oferty, natomiast obecnie od pojawienia się ogłoszenia do sfinalizowania transakcji mija

przynajmniej pół roku [1].

Często wykorzystywanym wskaźnikiem mówiącym o zamożności obywateli kraju jest

liczba metrów kwadratowych, którą można nabyć za przeciętne wynagrodzenie (rys. 2).

Jednak indeks ten potrafi się różnić nawet o 30% w zależności od źródła publikacji i

wykorzystanej metody estymacji. Dane z systemu AMRON bazujące na dochodzie netto

wskazują, że siła nabywcza wzrosła do roku 2014 o prawie 60% w porównaniu z rokiem 2007

[2].

Rys. 2: Średnie ceny mieszkań w odniesieniu do przeciętnego wynagrodzenia. Źródło [1]

7

Przez rok 2015 znacznie wzrosła cena mieszkań na rynku wtórnym. W niektórych

miastach ceny używanych mieszkań przewyższają ceny nowych, od deweloperów. Najwyżej

cenione są mieszkania o powierzchni 38-60 metrów kwadratowych, które w Warszawie

kosztują średnio 7778 zł/mkw w przypadku rynku pierwotnego oraz 8060 zł/mkw w

przypadku rynku wtórnego [3]. Z przeanalizowanych raportów [3], [4] i [5] wynika, że ceny

nowych mieszkań ulegały zmianom w ciągu ostatnich 2 lat, jednak nie tak drastycznym jak w

przypadku nieruchomości z rynku wtórnego. Przykładowo, w ostatnim (drugim) kwartale

2016 roku, średnia cena sprzedanych mieszkań wzrosła o 2,2% w porównaniu do I kwartału i

o 3% w porównaniu do analogicznego okresu w roku 2015. Dla porównania, zdecydowana

większość mieszkań sprzedanych w przeciągu ostatnich 2 lat w Warszawie kosztowała od 6

do 10 tysięcy złotych za metr kwadratowy.

Podsumowując, ceny mieszkań ulegają nieustannym, lecz nieznacznym wahaniom,

dotyczy to zwłaszcza nieruchomości pochodzących z rynku pierwotnego. Można więc

założyć, że te zmiany w czasie nie miały istotnego wpływu na średnie ceny mieszkań w ciągu

ostatnich 2 lat.

Sformułowanie problemu 1.2.

Niniejszy podrozdział pracy stanowi sformułowanie zagadnienia będącego tematem

pracy, a także opis próby zebrania i analizy czynników, które poprzez wpływ na komfort życia

mieszkańców decydują o atrakcyjności mieszkania dla potencjalnego nabywcy, a w rezultacie

kształtują ceny nieruchomości.

Zagadnienie wyceny nieruchomości 1.2.1.

Z punktu widzenia polskiego prawa, wg Ustawy o gospodarce nieruchomościami z 21

sierpnia 1997 roku, wycena nieruchomości to proces określenia wartości rynkowej,

odtworzeniowej i katastralnej danej nieruchomości. Z punktu widzenia niniejszej pracy

istotna jest oczywiście wartość rynkowa, która jest uzależniona zarówno od popytu jak i

podaży mieszkań. Zgodnie z prawem popytu i podaży, w warunkach niezmienności

8

pozostałych zjawisk rynkowych, nadwyżka popytu nad podażą powoduje wzrost ceny,

natomiast nadwyżka podaży nad popytem jest przyczyną spadku ceny.

Podejście do zagadnienia przyjęte przez autora jest zgoła odmienne od klasycznej

wyceny nieruchomości dokonywanej przez rzeczoznawców. W kontekście niniejszej pracy

wyceną nieruchomości jest próba określenia ścisłych, matematycznych zależności pomiędzy

cechami charakteryzującymi mieszkanie, a jego wartością rynkową, czyli de facto

modelowanie cen nieruchomości w zależności od opisujących je czynników. Tak więc badana

jest tu de facto strona konsumencka, czyli popyt na mieszkania. Pominięte zostały czynniki

związane z podażą, czyli liczbą mieszkań na rynku oferowanych przez deweloperów.

Podsumowując, niniejsza praca bada konsumencką stronę zagadnienia wyceny

nieruchomości z rynku pierwotnego, analizując czynniki wpływające na to, ile potencjalny

nabywca jest skłonny zapłacić za konkretne mieszkanie.

Czynniki wpływające na wartość nieruchomości 1.2.2.

Aby móc podjąć próbę tworzenia matematycznego modelu zależności cen mieszkań

od cech charakteryzujących poszczególne lokale, należy określić zbiór tych własności oraz

możliwość ich dyskretyzacji, tj. przypisania wartości liczbowej ze skończonego zbioru,

określającej natężenie danej cechy. Przede wszystkim, należy wyróżnić cechy odnoszące się

do danej inwestycji mieszkaniowej lub ogólniej mówiąc pewnego zbioru lokali, np.

położonych w tej samej okolicy. Będą to pewne własności wspólne dla wielu mieszkań, jak

choćby możliwość dojazdu windą – charakterystyczna dla wszystkich lokali w tym samym

budynku, a przynajmniej w tej samej klatce schodowej.

Inne takie cechy to np. nasłonecznienie, rozumiane jako okres w ciągu dnia, podczas

którego światło słoneczne wpada bezpośrednio do pomieszczeń, a zależne głównie od strony

świata, z której są okna oraz, w mniejszym stopniu, piętra, na którym znajduje się rozważane

mieszkanie. Niektóre własności, jak np. rozmieszczenie pokoi w lokalu, wiążą się z wygodą

mieszkania, jednak są trudno mierzalne – można mówić jedynie o dobrym/dogodnym lub

złym/niewygodnym rozkładzie pokoi.

9

Cechy takie jak nasłonecznienie lub układ mieszkania są charakterystyczne (posiadają

identyczne lub bardzo podobne natężenie/wartość) dla pewnego zbioru lokali, mniejszego

niż zbiór mieszkań w całej inwestycji. Jednak przy określaniu cech wspólnych pewnych grup

lokali, dla uproszczenia rozważań należy ograniczyć się wyłącznie do cech

charakterystycznych dla całych budynków/inwestycji mieszkaniowych, a cechy takie, jak

nasłonecznienie czy wielkość balkonu potraktować jako cechy indywidualne lokalu.

Można również wskazać własności charakterystyczne dla konkretnej inwestycji

mieszkaniowej (a co za tym idzie wspólne dla wszystkich lokali w jej obrębie), takie jak np.

jakość materiałów użytych do budowy budynku, standard wykonania części wspólnych

(klatek schodowych, placów zabaw itp.), a także cechy wspólne dla inwestycji różnych

deweloperów, a znajdujących się blisko siebie, np. dostępność lokali usługowych,

komunikacji zbiorowej, wskaźnik przestępczości na danym osiedlu itp.

Ograniczenie rozważań do wyłącznie nowych mieszkań w stanie surowym ułatwia

analizę ze względu na identyczny standard wykończenia wszystkich mieszkań, a właściwie

jego brak – zróżnicowanie jakości materiałów użytych do wykończenia mieszkania (tynki,

podłogi, glazury itp.) oraz wyposażenia i mebli w lokalu mogłoby w znacznym stopniu

wpływać na atrakcyjność i wartość poszczególnych mieszkań.Zdefiniowanie, kategoryzacja

oraz dyskretyzacja cech mieszkań są tematem dalszych rozdziałów pracy – szczegółowej

analizy zagadnienia.

Cel pracy 1.3.

Podsumowując rozważania przedstawione we wstępie, niniejsza praca porusza

zagadnienie wyceny nieruchomości od strony konsumenckiej. Celem pracy było zapoznanie

się z rynkiem mieszkań, określenie i analiza cech wpływających na atrakcyjność mieszkań,

która ma bezpośrednie odzwierciedlenie w ich jednostkowej cenie (za każdy metr

kwadratowy), a następnie stworzenie i weryfikacja modelu matematycznego zależności cen

mieszkań od najistotniejszych parametrów je opisujących. Zostały przedstawione,

teoretycznie uzasadnione i sprawdzone pewne hipotezy dotyczące omawianej zależności. W

niniejszej pracy przyjęto, że cena jednostkowa mieszkania jest miarą jego atrakcyjności, a

więc wartości atrakcyjności są równe wartościom cen za metr kwadratowy.

10

Zakres pracy 1.3.1.

Ceny mieszkań w obrębie kraju wykazują znaczne zróżnicowanie. W samych

największych miastach ceny za metr kwadratowy mogą różnić się o ponad połowę –

przykładowo średnia wartość nowego mieszkania o metrażu 38-60 mkw w Katowicach w

styczniu 2016 roku wynosiła w 5022 zł, natomiast za podobne mieszkanie w Warszawie

trzeba było zapłacić 7814 zł za każdy metr kwadratowy.W związku z powyższym należało

ograniczyć rozważania, przynajmniej początkowo, do jednego miasta. Oczywistym wyborem

była Warszawa, w której notuje się najwięcej transakcji kupna/sprzedaży mieszkań. Ponadto

dane transakcyjne są udostępniane (pod pewnymi warunkami) przez Biuro Geodezji i

Katastru Urzędu Miejskiego.

Fakt, że nowe mieszkania od deweloperów są zazwyczaj sprzedawane w stanie

surowym, upraszcza analizę rynku nowych mieszkań, ponieważ na cenę lokalu nie wpływa

czynnik związany z jakością indywidualnego wykończenia – można założyć, że wszystkie

mieszkania są pod tym względem jednakowe, tj. nie posiadają żadnego wyposażenia.

Tak jak zostało to powiedziane we wstępie, kilkuprocentowe wahania cen na

przestrzeni ostatnich kilku lat nie mają istotnego wpływu na ceny mieszkań, które dla

Warszawy wahają się od 6 do 10 tys. zł za metr kwadratowy.Podsumowując powyższe fakty,

za zakres niniejszej pracy przyjęto rynek nowych mieszkań oferowanych przez deweloperów

na terenie stolicy. Analizie poddano transakcje, których dokonano w okresie ostatnich 2 lat.

11

2. Przegląd obecnego stanu wiedzy

Niniejszy rozdział zawiera podsumowanie przeprowadzonych do tej pory badań i

analiz dotyczących zagadnienia modelowania cen nieruchomości w kontekście zarówno

polskiego rynku mieszkań, jak i rynków zagranicznych. Przedstawione opracowania poruszają

różne strony problemu – zależność wartości mieszkań od ich otoczenia, np. bliskości terenów

zielonych, akwenów, terenów przemysłowych, a także od zmian klimatu.

Ponadto, dokonano przeglądu dwu interesujących rozwiązań związanych z

omawianym zagadnieniem, które wspomagają proces oceny wartości nieruchomości poprzez

jego częściową automatyzację przy użyciu pewnych modeli. Pierwsze z nich to wskaźnik Walk

Score używany za granicą (głównie w Stanach Zjednoczonych) do określania atrakcyjności

konkretnych lokalizacji jak i całych miast pod względem wygody w poruszaniu się

komunikacją zbiorową, bliskości punktów użyteczności publicznej itp. Drugie rozwiązanie to

portal Szybko.pl, który oferuje bezpłatną usługę wyceny mieszkania po podaniu jego

parametrów i lokalizacji. Algorytm wyceny opiera się na dotychczas zrealizowanych

transakcjach kupna/sprzedaży mieszkań w najbliższym sąsiedztwie.

Istniejące opracowania i literatura 2.1.

Zagadnienie wyceny nieruchomości oraz modelowania cen mieszkań było tematem

wielu prac, które przedstawiały różne metody analizy problemu.

Publikacje dotyczące rynków zagranicznych 2.1.1.

Praca [6] przedstawia analizę wpływu otoczenia nieruchomości na ceny jednostkowe

mieszkań przy użyciu regresji hedonicznej. Badanie dotyczy miasta Kolonii w Niemczech.

Autorzy stwierdzają, że zwiększenie powierzchni zieleni miejskiej w promieniu 500 metrów o

1% powoduje wzrost wartości mieszkania o 0,1%, natomiast zwiększenie powierzchni zajętej

przez akweny o 1% w identycznym obszarze (500 m) powoduje wzrost ceny o 0,16%. Wynika

z tego, że obecność zbiorników wodnych jest ceniona bardziej niż zieleń miejska i w

większym stopniu wpływa na wartość nieruchomości. Dodatkowo, z każdym rokiem wieku

12

mieszkania, jego cena spada o 0,22%. Analiza dotyczyła 85046 transakcji dokonanych na

przestrzeni lat 1995-2012.

Autorzy w pracy [7] wyróżniają następujące czynniki warunkujące ceny mieszkań:

powierzchnia mieszkania/domu, liczba pięter, powierzchnia działki, standard i stan otoczenia

mieszkania (rozumianego jako podwórko, ogród itp.) (dobry/słaby), liczba pokoi, liczba

łazienek, obecność garażu. Przedstawiony został model wielomianowy opisujący cenę

nieruchomości w zależności od liczbowej wartości powyższych parametrów, przy przyjęciu

możliwych wartości 0 i 1 dla zmiennych takich, jak obecność garażu i stan otoczenia

mieszkania. Próba użyta do badania to 81 mieszkań.

Publikacja [8] dotyczy wykorzystania Systemu Informacji Geograficznej (GIS) do

stworzenia hedonicznego modelu cen nieruchomości. Badanie dotyczyło mieszkań w

najbliższej okolicy Glasgow w Wielkiej Brytanii. Autorzy opisali metodę określania cech

charakteryzujących nieruchomości, dzięki której udało się zdefiniować ponad 320 takich

własności. Po analizie zostały odrzucone cechy o wysokiej wzajemnej korelacji, jak i te o

znikomym wpływie na ceny mieszkań. Próba liczyła 3456 transakcji.

W pracy [9] przedstawione zostały wyniki analizy hedonicznego modelu cen mieszkań

w hrabstwie Marion w stanie Indiana w Stanach Zjednoczonych, obejmującej 8772 transakcji

zakupu/sprzedaży domów. Wg autorów czynnikami kształtującymi ceny domów w

największym stopniu są cechy samych nieruchomości, takie jak liczba łazienek, wielkość

ogrodu, obecność piwnicy i klimatyzacji. Lokalizacja domu i aspekty z nią związane, tj. czas

dojazdu do centrum, bliskość szkół, w mniejszym stopniu determinują jego wartość.

Publikacje dotyczące rynku polskiego 2.1.2.

Opracowanie [10] przedstawia analizę cen mieszkań w wybranych dzielnicach

Warszawy, na podstawie próby 1485 cen z danych ofertowych z lat 2008-2010. Autor

zweryfikował wpływ następujących czynników na wartość nieruchomości: obecność ochrony

w budynku, obciążenie mieszkania kredytem hipotecznym, budowa budynku przez II wojną

światową, powierzchnia mieszkania, wiek mieszkania, średnia cena mieszkania w danej

dzielnicy w minionym okresie. Przedstawiony przez autora model charakteryzuje się

dopasowaniem wartości teoretycznych do empirycznych na poziomie 76,3%. Warto

13

podkreślić, że dane ofertowe, które zostały użyte podczas tworzenia modelu, mogą się

nieznacznie różnić od rzeczywistych cen transakcyjnych.

Publikacja [11] opisuje metody wyznaczania hedonicznych indeksów cen mieszkań

przy użyciu danych z Bazy Rynku Nieruchomości prowadzonej prze NBP. Autorzy posługując

się wiedzą ekspercką określili 19 zmiennych wpływających bezpośrednio na atrakcyjność i

ceny lokali, z czego 5 zmiennych odnosiło się do lokalizacji. Jednak ze względu na braki

danych zbiór zmiennych wykorzystywanych w modelowaniu ograniczono do 12, z czego tylko

2 odnosiły się do lokalizacji. Pozostałe zmienne objaśniające określały m.in. standard

wykończenia mieszkania, technologię budowy budynku, typ kuchni przyjmując wartość ze

skończonego zbioru ustalonego przez autora. Ponadto, omawiane zmienne określały także

liczbę pokoi czy obecność windy. Wykorzystano dane z 1494 transakcji dokonanych w latach

2006-2009 w obrębie stolicy. Zgodnie z wynikami analizy, usytuowanie mieszkania w dobrej

dzielnicy podnosi cenę metra kwadratowego o około 29%, natomiast cena metra

kwadratowego mieszkania jedno– lub dwupokojowego jest o około 8% wyższa niż cena

metra kwadratowego większych mieszkań. Ponadto, mieszkania o wysokim standardzie

wyposażenia są droższe od mieszkań o przeciętnym standardzie średnio o 9%.

Rozwiązania automatyzujące proces oceny wartości 2.2.

nieruchomości

Proces tworzenia modelu matematycznego cen mieszkań, składający się z określenia

zmiennych objaśniających, doboru klas funkcji i wyznaczaniu współczynników jest dość

praco- i czasochłonny. Ponadto zagadnienie wymaga analizy znacznej liczby danych

dotyczących cen i charakterystyk mieszkań (rzędu tysięcy) w celu uzyskania wyników w

odpowiednim stopniu zgodnych z rzeczywistością.

W związku z powyższym niezbędne jest wykorzystanie narzędzi automatyzujących

przynajmniej część procesu, potrafiących dokonać szybkiej analizy dużej ilości danych przy

określonych warunkach. Spośród istniejących narzędzi wybrano dwa, które, choć działają w

zgoła odmienny sposób i na różnych danych, wyznaczając inne rodzaje wartości, to

automatyzują pewne czynności związane z zagadnieniem będącym tematem pracy.

14

Pierwsze z narzędzi to wskaźnik Walk Score używany do określania atrakcyjności

konkretnych lokalizacji jak i całych miast pod względem wygody życia mieszkańców. Drugie

rozwiązanie to portal Szybko.pl, oferujący bezpłatną usługę wyceny mieszkań w oparciu o

dotychczas zrealizowane transakcjach kupna/sprzedaży mieszkań w najbliższym sąsiedztwie.

Walk Score 2.2.1.

Walk Score to firma oferująca usługi walkability1 oraz wyszukiwania mieszkań

poprzez stronę www (rys. 3) i aplikację mobilną [13]. Głównym i najbardziej znanym

produktem jest indeks Walk Score, który przypisuje liczbowy wynik określający walkability

dowolnego miejsca w Stanach Zjednoczonych, Kanadzie i Australii. Walk Score jest używany

przez wiele agencji nieruchomości jako wiarygodny wskaźnik wygody codziennego życia

oferowanej przez daną lokalizację [12]. Walk Score wyznacza również indeks dla polskich

miast, jednak w tym przypadku funkcjonalność serwisu jest ograniczona.

Rys. 3: Główna strona portalu WalkScore.com. Źródło [12]

1 Słowo walkability nie ma polskiego odpowiednika. Walkable oznacza możliwy do przebycia pieszo, osiągalny

na piechotę. W kontekście pracy walkable oznacza, że dana lokalizacja jest przyjazna dla poruszania się po mieście pieszo, ew. rowerem czy komunikacją zbiorową; wiele punktów użyteczności publicznej jest dostępnych w zasięgu krótkiego spaceru, bez potrzeby używania samochodu itp. Walkability jest więc miarą wygody, jaką oferuje dana lokalizacja dla osoby preferującej poruszanie się pieszo.

15

Wskaźnik Walk Score danej lokalizacji jest wyznaczany poprzez określenie liczby

punktów użyteczności publicznej (POI) w najbliższym jej otoczeniu, tj. w zasięgu

kilkuminutowego spaceru (rys. 4). Im więcej POI, takich jak np. poczta, restauracje, sklepy w

okolicy, tym więcej codziennych obowiązków można załatwić nie używając żadnych środków

komunikacji.

Walk Score jest zatem pewną miarą atrakcyjności lokalizacji mieszkań, może zatem

być czynnikiem częściowo determinującym cenę lokali – im wyższy wskaźnik cechuje daną

lokalizację, tym więcej będą kosztować mieszkania znajdujące się w okolicy. Naturalnym jest,

że indeks rośnie w kierunku centrów miast, gdzie znajduje się dużo punktów użyteczności

publicznej i mieszkania są odpowiednio droższe niż np. na dzielnicach obrzeżnych.

Rys. 4: Wskaźnik Walk Score wyznaczony dla ulicy Prostej w Warszawie, wraz z

zaznaczonymi na mapie najbliższymi punktami użyteczności publicznej. Źródło [12]

Portal Walk Score oferuje również wskaźniki Bike Score oraz Transit Score. Pierwszy –

Bike Score – określa atrakcyjność lokalizacji dla rowerzystów, uwzględniając obecność

ścieżek rowerowych i połączenia między nimi oraz pagórkowatość terenu, co przekłada się

na dostępność i bliskość typowych celów podróży. Transit Score mówi natomiast o tym, jak

16

dobrze okolica jest obsługiwana przez komunikację zbiorową, co jest zależne od liczby linii i

rodzaju środków transportu (autobus, metro) dostępnych w danym miejscu.

Szybko.pl 2.2.2.

Platforma Szybko.pl jest grupą kilkudziesięciu serwisów ogłoszeniowych

gromadzących różnego rodzaju oferty, w szczególności z rynku nieruchomości [14]. Oprócz

publikacji ogłoszeń o sprzedaży/wynajmie nieruchomości, portal oferuje bezpłatną usługę

wyceny mieszkania oraz informacje o cenach ofertowych mieszkań w różnych miastach w

Polsce [15].

Aby serwis wyznaczył najbardziej prawdopodobną wartość nieruchomości, należy

podać jej najważniejsze parametry, takie jak: dokładny adres, rodzaj nieruchomości,

powierzchnia użytkowa, liczba pokoi, łazienek, piętro, obecność windy, parkingu, rok

budowy budynku oraz standard wykończenia. Na podstawie tych danych oraz informacjach z

ofert dotyczących lokali w najbliższym otoczeniu wybranej lokalizacji, ustalana jest

najbardziej prawdopodobna cena mieszkania.

Rys. 5: Przykładowa wycena dwupokojowego mieszkania w centrum Warszawy. Na mapie

zaznaczone są mieszkania z najbliższej okolicy wraz z ich cenami ofertowymi. Źródło: [15]

17

Portal oferuje ponadto informacje o cenach ofertowych mieszkań przedstawione na

mapie (rys. 5) jako pojedyncze punkty odpowiadające ogłoszeniom oraz kartogram ukazujący

średnie ceny mieszkań w mieście (kolor i odcień odpowiadają średnim cenom, zgodnie z

legendą).

Rys. 6: Mapa ukazująca średnie ceny mieszkań. Źródło: [13]

Podsumowanie przedstawionych opracowań i rozwiązań 2.3.

Omówione prace ukazują różne podejścia do modelowania cen mieszkań, zarówno na

rynku polskim, jak i na rynkach zagranicznych. Rozpatrywano wiele czynników wpływających

na atrakcyjność i wartość nieruchomości, takich jak parametry samego lokalu/domu, jego

otoczenie oraz lokalizację. Zależnie od typu nieruchomości (mieszkanie w bloku albo dom

wolnostojący) oraz od miasta, dla którego wybrano próbę transakcji lub ofert

kupna/sprzedaży, można zauważyć, że różne czynniki w niejednakowym stopniu wpływają na

wartość nieruchomości.

18

W przypadku domów jednorodzinnych można wywnioskować, że dla potencjalnych

kupców istotne jest najbliższe otoczenie posesji, tj. ogródek, ulica, osiedle, a w mniejszym

stopniu czynniki związane z jej lokalizacją, np. czas dojazdu do centrum. W przypadku

mieszkań w blokach nieco większa rolę odgrywa lokalizacja, a mniejszą wagę przywiązuje się

do czynników typowych dla domu jednorodzinnego. Wynika to prawdopodobne z typu

posesji oraz być może z preferencji nabywców.

Można wysnuć hipotezę, że nowe mieszkania w blokach kupują zazwyczaj młodzi

ludzie, niekiedy nieposiadający jeszcze dzieci, aktywnie spędzający wolny czas i ceniący sobie

bliskość miejsca pracy i centrum rozrywkowego miasta. Natomiast posesje jednorodzinne

mogą znajdować kupców głównie pośród rodzin z dziećmi, które preferują mieszkanie we

własnym domu z ogródkiem, w cichszej i spokojniejszej okolicy oddalonej od miejskiego

zgiełku.

Z drugiej strony można by próbować wyciągać wnioski dotyczące preferencji

mieszkańców miast o różnej wielkości, zaludnieniu czy też w różnych krajach. Jednak aby

próbować wyciągać wnioski na ten temat, należałoby przeanalizować znacznie więcej

opracowań dotyczących różnych miast w różnych krajach świata. Taka analiza może zostać

pominięta, gdyż nie jest bezpośrednio związana z tematem pracy.

Przedstawione opracowania dotyczące Warszawy zawierają analizę i próby

modelowania cen mieszkań z uwzględnieniem czynników zależnych głównie od wieku

budynku, jakości wykończenia zarówno lokalu jak i całego budynku, liczby i charakteru

pomieszczeń oraz w mniejszym stopniu lokalizacji nieruchomości. Nie rozpatrywano np.

odległości od typowych celów podróży (centrum miasta, miejsca pracy, punkty użyteczności

publicznej), która może być mierzona zarówno w jednostkach długości jak i orientacyjnym

czasie podróży komunikacją zbiorową, własnym pojazdem bądź pieszo.

Wskazanie nieopracowanej strony zagadnienia 2.3.1.

Tak jak wspomniano powyżej, przeprowadzone dotychczas analizy cen mieszkań tylko

w niewielkim stopniu skupiały się na aspektach związanych z lokalizacją nieruchomości. W

rzeczywistości położenie nieruchomości na mapie miasta przekłada się na dostępność usług,

punktów użyteczności publicznej, sieci dróg oraz komunikacji zbiorowej, co bezpośrednio

19

wpływa na komfort życia mieszkańców. W związku z tym ceny gruntów, nieruchomości i

lokali są odpowiednio wyższe w lepiej skomunikowanych częściach miasta – występuje

naturalna tendencja do wzrostu cen w kierunku centrum, natomiast potencjalni nabywcy są

skłonni zapłacić więcej za mieszkanie gwarantujące wyższy komfort życia.

Istniejące na polskim rynku rozwiązanie oferowane przez portal Szybko.pl potrafi

określać przybliżone ceny mieszkań na podstawie wielu czynników, jednak głównym i

decydującym wydają się być ceny transakcji dokonanych dla mieszkań z najbliższej okolicy.

Ponadto szczegółowe parametry modelu używanego do wyznaczania cen nie są podane.

Rysunek 6 obrazuje średnie ceny mieszkań w Warszawie wg Szybko.pl. Zauważyć

można wyższe średnie ceny nieruchomości w centrum oraz kilku innych miejscach. O ile

mieszkania zlokalizowane w Śródmieściu są atrakcyjniejsze i droższe niż na obrzeżach, to

ceny nieruchomości w podwarszawskim Raszynie czy obrzeżnych dzielniacach (Wawer,

Targówek) wydają się być zawyżone. Można podejrzewać, że model cen mieszkań

wykorzystywany przez portal Szybko.pl nie do końca poprawnie opisuje ich wartości w

pewnych obszarach miasta. Stwarza to dodatkową motywację do opracowania

alternatywnego sposobu określania wartości nieruchomości.

Doprecyzowanie celu pracy 2.3.2.

Za cel pracy przyjęto zapoznanie się z rynkiem mieszkań, określenie i analizę

czynników wpływających na atrakcyjność mieszkań, która ma bezpośrednie odzwierciedlenie

w ich cenie, a następnie stworzenie i weryfikacja modelu matematycznego zależności cen

mieszkań od najistotniejszych parametrów je opisujących.

Uwzględniając przeprowadzone dotychczas analizy oraz ich wyniki jak i pomysły

zaczerpnięte z przedstawionych istniejących rozwiązań postanowiono w niniejszej pracy

skupić się na kształtujących ceny nieruchomości cechach wynikających z dokładnego

położenia na mapie miasta – w odniesieniu do istniejących punktów użyteczności publicznej,

sieci dróg oraz sieci komunikacji zbiorowej – a także opisujących same lokale jak i całe

inwestycje mieszkaniowe w sposób ilościowy.

20

3. Analiza zagadnienia

Niniejszy rozdział opisuje przeprowadzoną analizę problemu modelowania cen

nieruchomości. Przedstawione zostały następujące zagadnienia:

• Metody wykorzystywane przy modelowaniu – regresja hedoniczna i automatyczny

model wyceny (AVM),

• Cechy składające się na atrakcyjność mieszkania – analiza i wybór najistotniejszych i

mających potencjalnie największy wpływ na wartość nieruchomości cech związanych

z lokalem, budynkiem oraz lokalizacją,

• Wykorzystane źródła danych – przegląd i opis wykorzystania źródeł danych o

atrybutach i cenach mieszkań oraz charakteryzujących lokalizacje pod kątem

dostępności usług, komunikacji zbiorowej i sieci dróg.

Dalsza część przedstawia opis zbierania, analizy i interpretacji danych:

• Akwizycja i agregacja danych – opis sposobów pozyskiwania, łączenia i analizowania

danych,

• Sformułowanie i weryfikacja hipotez dotyczących zależności cen mieszkań od

omówionych czynników,

• Wnioski wypływające z wykonanej analizy – potwierdzone i odrzucone hipotezy.

Szczegółowy opis sposobu modelowania i wyznaczania cen 3.1.

mieszkań

Do badania zależności cen nieruchomości od cech je opisujących wykorzystano

metodę regresji hedonicznej. Natomiast do wyznaczania najbardziej prawdopodobnej

wartości mieszkania użyto automatycznego modelu wyceny (AVM).

Regresja hedoniczna 3.1.1.

Regresja jest metodą statystyczną, która umożliwia badanie zależności występujących

pomiędzy danymi oraz dzięki temu przewidywanie wartości pewnych wielkości z

wykorzystaniem dostępnych i znanych wartości innych wielkości [16].

21

Użycie regresji w praktyce sprowadza się do dwóch etapów:

• konstruowanie modelu – polega na stworzeniu modelu regresyjnego, czyli funkcji

opisującej zależności pomiędzy zmienną objaśnianą a zmiennymi objaśniającymi.

Taka funkcja może przybrać postać zarówno prostego wzoru matematycznego, jak

również skomplikowanego algorytmu w postaci drzewa regresyjnego czy też sieci

neuronowej. Model jest konstruowany w taki sposób, aby jak najlepiej pasował do

danych ze zbioru uczącego (zawierającego zmienne objaśniające i zmienne

objaśniane).

• stosowanie modelu (scoring) – wykorzystanie skonstruowanego wcześniej modelu na

danych zawierających wyłącznie zmienne objaśniające w celu określenia na ich

podstawie wartości oczekiwanej zmiennej objaśnianej.

Koncepcja hedonicznego modelu cen opiera się na następującym założeniu: dobra

heterogeniczne (czyli takie, które różnią się między sobą pewnymi cechami, np.

nieruchomości) mogą zostać przedstawione jako zespół pewnych cech je charakteryzujących

[11]. Z punktu widzenia konsumenta każdej z tych cech przypisana jest pewna użyteczność,

natomiast cena produktu jest sumą (nieobserwowalnych) użyteczności poszczególnych cech,

gdyż same cechy nie są przedmiotem transakcji i nie mają określonych wartości pieniężnych.

Modele hedoniczne przybierają postać modeli ekonometrycznych, w których zmienną

objaśnianą jest cena – wartość produktu, a zmiennymi objaśniającymi – charakterystyki

produktu mające według założenia istotny wpływ na ostateczną cenę [11]. Cena

heterogenicznego dobra jest w związku z tym sumą wartości poszczególnych cech je

charakteryzujących opisanych za pomocą zmiennych objaśniających oraz innych czynników

odzwierciedlonych w składniku losowym.

Zgodnie z powyższym, ogólny model wartości dobra heterogenicznego przybiera

następującą postać:

� = ∑ �� + (1)

gdzie:

� – wartość dobra heterogenicznego (np. cena mieszkania),

�� – natężenie pewnej cechy dobra (np. powierzchnia mieszkania),

�� - funkcja przyporządkowująca natężeniu pewnej cechy �� pewną wartość,

�� –wartość, jaką pewna cecha �� dobra stanowi dla konsumenta,

22

– składnik losowy modelu,

� ∈ �1,2,3, … , ��,

� – liczba cech opisujących mieszkanie.

W związku z charakterem powyższej zależności, do wyznaczania modelu wartości

nieruchomości została wykorzystana regresja liniowa, która zakłada liniową zależność

pomiędzy zmienną objaśnianą, a zmiennymi objaśniającymi [17]. Jeżeli przyjąć, że �� jest

wartością atrakcyjności wynikającej z natężenia pewnej cechy i jest proporcjonalne do

��, zagadnienie sprowadza się do regresji liniowej wartości nieruchomości � względem

parametrów ��, a więc:

� = ∑ �� + � + (2)

gdzie �� jest współczynnikiem liniowej zależności dla � ∈ �1,2,3, … , ��, natomiast � to pewna

stała wartość.

Podsumowując, metoda regresji hedonicznej zakłada, że wartość pewnego dobra (w

tym przypadku mieszkania) jest sumą wartości poszczególnych, obserwowalnych jego cech,

takich jak np. jakość wykończenia, atrakcyjność lokalizacji itp. Powyższe cechy są traktowane

jako zmienne objaśniające, natomiast cena jest zmienną przez nie objaśnianą. Celem jest

wyznaczenie takiego modelu, który mógłby z powodzeniem przewidywać w przyszłości ceny

nowych mieszkań.

AVM – automatyczny model wyceny 3.1.2.

AVM (Automated Valuation Model - Automatyczny Model Wyceny) jest usługą

umożliwiającą wyznaczanie wartości nieruchomości przy użyciu modelu matematycznego

oraz bazy danych zawierającej informacje o innych nieruchomościach na rynku. Algorytm

analizuje duże ilości danych oraz cechy konkretnej nieruchomości, aby następnie oszacować

wartość rynkową danego obiektu [18].

Technologia AVM wykorzystywana jest podczas wyceny nieruchomości przez

rzeczoznawców, instytucje kredytowe oraz inwestorów. Wykonywana przez AVM wycena

powstaje w wyniku połączenia badania i przetwarzania dostępnych danych oraz zależności

23

przyjętych w modelu. Wykorzystywane są dwa rodzaje danych: informacje o cechach

związanych z nieruchomością oraz dane transakcyjne [14].

AVM zazwyczaj obejmuje swym badaniem [18]:

• opinie rzeczoznawców majątkowych i analityków rynku,

• informacje na temat nieruchomości,

• ceny transakcyjne,

• analizę porównawczą podobnych nieruchomości.

Podsumowując, AVM służy do szybkiego przewidywania cen mieszkań przy użyciu

przeanalizowanych danych o innych nieruchomościach i dotychczas zrealizowanych

transakcjach oraz cechach opisujących wyceniane mieszkania.

W niniejszej pracy założenia AVM zostanły wykorzystane przy tworzeniu i weryfikacji

modelu cen nieruchomości, natomiast docelowo AVM będzie wykorzystywany do

przewidywania wartości nowych mieszkań z wykorzystaniem opracowanego modelu oraz

historycznych danych transakcyjnych. Regresja hedoniczna była przeprowadzana przy

wykorzystaniu automatycznego modelu wyceny do określania przewidywanych wartości

nieruchomości na podstawie informacji o cechach je charakteryzujących.

Określenie składowych atrakcyjności mieszkania 3.2.

W celu stworzenia matematycznego modelu opisującego wartość nieruchomości,

należy przede wszystkim określić cechy je opisujące. Zgodnie z hedonicznym modelem cen,

który opiera się na założeniu, że dobra (w tym wypadku mieszkania) można przedstawić jako

agregat ich cech istotnych z punktu widzenia konsumenta, należało wyróżnić atrybuty je

charakteryzujące i tworzące omawiany hedoniczny koszyk atrybutów:

• mieszkanie, takie jak np. liczba pokoi, piętro;

• całą inwestycję (budynek lub grupę budynków), np. jakość materiałów użytych przy

budowie, obecność garażu podziemnego;

• lokalizację nieruchomości, np. odległość od centrum.

Powyższe cechy połączono w 2 grupy:

24

1. odnoszące się do standardu mieszkania (połączenie atrybutów samego mieszkania

oraz inwestycji, w której się znajduje) oraz

2. dotyczące lokalizacji nieruchomości.

Spośród własności charakteryzujących mieszkania należało wybrać te, którym można

przypisać wartości liczbowe z pewnego zbioru tak, aby było możliwe ilościowe określenie

natężenia danych cech, co jest warunkiem koniecznym, aby móc uwzględnić je w procesie

modelowania.

Parametryzacja opisu nieruchomości 3.2.1.

Lokal mieszkalny może być scharakteryzowany przez szereg cech wpływających w

mniejszym lub większym stopniu na komfort mieszkańców. Poza podstawowymi, takimi jak

metraż i liczba pomieszczeń, istotne są również wysokość mieszkania, charakter pomieszczeń

– liczba łazienek, sypialni, rodzaj kuchni, obecność i powierzchnia balkonu. Niektóre cechy są

trudne, a czasami wręcz niemożliwe do dokładnego opisania ilościowego.

Poniżej przedstawiono cechy charakterystyczne dla lokali mieszkalnych oraz

inwestycji mieszkaniowych wraz z propozycjami zbiorów wartości liczbowych określających

natężenie danej cechy. Atrybuty i zbiory wartości zostały częściowo zaczerpnięte z literatury

przedstawionej w rozdziale 2.1.

Tabela 1: Cechy mieszkań wpływające na komfort i atrakcyjność nieruchomości

Cecha Typ zbioru wartości cechy

(ciągły/dyskretny)

Zbiór wartości opisujących

natężenie cechy

Metraż Ciągły Wartość powierzchni w metrach kwadratowych

Liczba pokoi Dyskretny Liczba pokoi (= 1, 2, 3, 4…)

Liczba łazienek Dyskretny Liczba łazienek (= 1, 2…)

Liczba sypialni Dyskretny Liczba sypialni (= 1, 2…)

Miejsce postojowe przypisane do lokalu

Dyskretny 0 – brak miejsca 1 – miejsce pod blokiem 2 – miejsce w garażu

Wysokość lokalu Ciągły Wartość wysokości lokalu w metrach albo 0 – przeciętna wysokość (ok. 2,5 m) 1 – lokal wysoki (ok. 3 m)

Obecność/powierzchnia balkonu/loggii

Ciągły/ Dyskretny 0 – brak balkonu/loggii 1 – balkon/loggia w lokalu albo

25

Wartość powierzchni balkonu/loggii w metrach kwadratowych

Rodzaj kuchni (zamknięta/otwarta)

Dyskretny 0 – zamknięta 1 – otwarta (W dużej mierze zależne od preferencji użytkowników lokalu)

Rozkład pokoi Możliwość arbitralnej oceny (dobry/przeciętny/słaby)

2 – dobry 1 – przeciętny 0 - słaby

Naświetlenie mieszkania Dyskretny 0 – okna tylko od północy 1 – okna z innych stron

Widok z okna Możliwość arbitralnej oceny (ładny, przeciętny, słaby)

2 – ładny 1 – przeciętny 0 - słaby

Rodzaj umowy sprzedaży Użytkowanie wieczyste/prawo własności

0 – użytkowanie wieczyste 1 – prawo własności

Tabela 2: Cechy inwestycji mieszkaniowych wpływające na komfort i atrakcyjność nieruchomości


(ciągły/dyskretny)

Zbiór wartości opisujących

natężenie cechy

Obecność windy Dyskretny 0 – brak windy 1 – winda w budynku

Obecność ochrony Dyskretny 0 – brak ochrony 1 – ochrona w budynku/na osiedlu

Dziedziniec z placem zabaw

Dyskretny 0 – brak dziedzińca 1 – dziedziniec przy budynku

Jakość materiałów użytych przy budowie budynku

Możliwość arbitralnej oceny (dobra, przeciętna, słaba)

2 – dobra 1 – przeciętna 0 - słaba

Recepcja i portier Dyskretny 0 – brak recepcji 1 – recepcja w budynku

Jakość wykończenia przestrzeni wspólnych

Możliwość arbitralnej oceny (dobra, przeciętna, słaba)

2 – dobra 1 – przeciętna 0 - słaba

Liczba kondygnacji budynku

Dyskretny Liczba kondygnacji (= 1, 2, 3…)

(Dodatkowy) parking pod budynkiem dla gości

Dyskretny 0 – brak parkingu 1 – parking pod budynkiem

Wszystkie powyższe cechy wpływają w pewnym stopniu na komfort życia

mieszkańców, zazwyczaj w oczywisty sposób – jak np. obecność windy lub miejsca

parkingowego), a czasami zależnie od indywidualnych preferencji – np. rodzaj kuchni czy

rozkład pokoi. Do analizy warto wykorzystać cechy wpływające w sposób oczywisty na

wygodę mieszkańców.

26

Lokalizacja nieruchomości 3.2.2.

Osobną kategorię stanowią cechy nieruchomości związane z jej położeniem na mapie

miasta, a nieodnoszące się w żaden sposób do samego mieszkania/budynku. Można tu

wyróżnić cechy związane z komfortem mieszkania i spędzania czasu wolnego, takie jak

natężenie hałasu czy bliskość terenów zielonych, jak również aspekty odnoszące się do tkanki

miejskiej, np. czas dojazdu do pracy czy dostępność komunikacji zbiorowej. Tak jak w

przypadku atrybutów związanych ze standardem nieruchomości, niektóre cechy są trudne, a

czasami wręcz niemożliwe do dokładnego opisania ilościowego.

Poniżej przedstawiono cechy związane z lokalizacją nieruchomości wraz z

propozycjami zbiorów wartości liczbowych określających natężenie danej cechy. Atrybuty i

zbiory wartości zostały częściowo zaczerpnięte z literatury przedstawionej w rozdziale 2.1.

Tabela 3: Cechy lokalizacji wpływające na komfort i atrakcyjność nieruchomości


(ciągły/dyskretny) Zbiór wartości opisujących natężenie cechy

Bliskość centrum

Ciągły Odległość od centrum miasta albo czas dojazdu do centrum miasta (samochodem/rowerem/komunikacją zbiorową)

Dostępność komunikacji miejskiej

Ciągły/Dyskretny Czas dojazdu do centrum miasta komunikacją miejską albo odległość od najbliższego przystanku albo liczba środków komunikacji miejskiej odjeżdżających z najbliższego przystanku w ciągu godziny

Natężenie hałasu

Cecha trudna do zmierzenia, możliwość arbitralnej oceny (wysokie, średnie, niskie)

0 – wysokie natężenie hałasu 1 – średnie natężenie hałasu 2 – niskie natężenie hałasu

Wskaźnik przestępczości

Dyskretny (na podstawie danych statystycznych)

0 – wysoki 1 – średni 2 – niski albo liczba przestępstw popełnionych w danej dzielnicy/osiedlu w ciągu ostatniego roku

Bliskość terenów zielonych

Ciągły/dyskretny Odległość do najbliższego parku albo liczba terenów zielonych w promieniu np. 2 kilometrów

Dostępność usług

Ciągły/dyskretny Odległość do najbliższego punktu usługowego wybranej kategorii (np. sklep, poczta, bank) albo liczba punktów usługowych w promieniu np. 1 kilometra

27

Warto zauważyć, że każdy potencjalny nabywca nieruchomości może w inny sposób

priorytetyzować powyższe cechy, np. w zależności od tego czy podróżuje komunikacją

zbiorową czy własnym samochodem, a także cenić sobie bardziej bliskość własnego miejsca

pracy niż bliskość ogólnie pojętego centrum miasta.

Ogólny model cen mieszkań 3.2.3.

Podsumowując powyższe rozważania, atrakcyjność nieruchomości jest pewną funkcją

standardu mieszkania/budynku oraz atrakcyjności lokalizacji. Zakładając niezależność tych

czynników, atrakcyjność (wartość) mieszkania można przedstawić jako sumę tych dwóch

podstawowych składowych:

� = �� + �� + + � = �� , �� + ��, �� + � + (3)

gdzie:

� – atrakcyjność mieszkania,

�� – atrakcyjność nieruchomości (mieszkania/budynku),

�� – atrakcyjność lokalizacji nieruchomości,

�� – funkcja atrakcyjności nieruchomości, przypisująca zestawowi cech �� związanych z

mieszkaniem/budynkiem pewną wartość (atrakcyjność),

�� – wektor cech związanych z mieszkaniem/budynkiem,

�� – wektor parametrów przypisanych do cech związanych z mieszkaniem/budynkiem,

��– funkcja atrakcyjności lokalizacji, przypisująca zestawowi cech �� związanych z lokalizacją

nieruchomości pewną wartość (atrakcyjność),

�� – wektor cech związanych z lokalizacją nieruchomości,

�� – wektor współczynników przypisanych do cech związanych z lokalizacją nieruchomości,


� – stała wartość (hipotetyczna cena mieszkania o zerowej atrakcyjności).

W opracowywanym modelu przyjęto założenie, że powyższe główne składowe, czyli

atrakcyjność samej nieruchomości oraz atrakcyjność lokalizacji, można przedstawić jako

sumy funkcji poszczególnych atrybutów. Jest to zgodne z teorią modeli hedonicznych, która

zakłada, że każde mieszkanie jest charakteryzowane przez zbiór istotnych z punktu widzenia

konsumenta cech.

28

W związku z tym atrakcyjność mieszkania/budynku będzie opisana jako suma

pewnych funkcji atrybutów ją charakteryzujących:

�� = ��!��, �� + �"�!�", ��"� + … + ��!�, �� + (4)

gdzie:


�� – �-ta składowa atrakcyjności nieruchomości, wynikająca z pewnej cechy !�,

!��– �-ta cecha związana z atrakcyjnością nieruchomości, taka jak np. obecność windy,

�� – współczynnik przypisany do �-tej cechy związanej z atrakcyjnością nieruchomości,


� ∈ �1,2,3, … , ��, !�� ∈ �� , �� ∈ ��

Analogicznie, atrakcyjność lokalizacji będzie opisana jako suma pewnych funkcji

atrybutów ją charakteryzujących:

�� = ��!��, �� + �"�!�", ��"� + … + ��!�, �� + (5)

gdzie:


�� – �-ta składowa atrakcyjności lokalizacji, wynikająca z pewnej cechy !�,

!��– �-ta cecha związana z atrakcyjnością lokalizacji, taka jak np. odległość od centrum,

�� – współczynnik przypisany do �-tej cechy związanej z atrakcyjnością lokalizacji,


� ∈ �1,2,3, … , ��, !�� ∈ �� , �� ∈ ��

Założenie niezależności składowych 3.2.4.

Tak jak wspomniano powyżej, zostało przyjęte ważne założenie o niezależności

standardu inwestycji mieszkaniowych od ich lokalizacji. Jednak w rzeczywistości można

dostrzec pewną korelację pomiędzy tymi czynnikami. W pewnych lokalizacjach powstaje

więcej budynków w wysokim standardzie (np. apartamentowce) – dotyczy to bardziej

prestiżowych lokalizacji, takich jak np. ścisłe centrum miasta czy chociażby sąsiedztwo

ambasad i innych ważnych instytucji. Z drugiej strony, istnieją w miastach miejsca, gdzie

powstaje dużo typowych bloków w średnim standardzie wykonania – dotyczy to zazwyczaj

dużych, rozwijających się osiedli.

29

Wykorzystane źródła danych 3.3.

Niniejszy podrozdział przedstawia dostępne i wykorzystane źródła danych. Zasadniczo

wykorzystane źródła danych można podzielić na dwie kategorie: informacje o cenach i

standardzie mieszkań oraz dane dotyczące aspektów związanych z ich lokalizacją w mieście.

Natomiast z punktu widzenia tworzonego modelu atrakcyjności mieszkań, dane można

podzielić na dane wejściowe (zmienne objaśniające – parametry modelu) oraz wartości

objaśniane, czyli ceny transakcyjne mieszkań.

Rejestr Cen i Wartości Nieruchomości 3.3.1.

Rejestr Cen i Wartości Nieruchomości (RCiWN) dla obszaru Warszawy prowadzi

Prezydent m. st. Warszawy za pośrednictwem Biura Geodezji i Katastru Urzędu m. st.

Warszawy [19].

Na informacje zawarte w RCiWN składają się dane pochodzące z:

• odpisów aktów notarialnych pochodzących z kancelarii notarialnych,

• szacunków przekazywanych przez rzeczoznawców majątkowych.

Baza RCiWN zawiera usystematyzowane dane w postaci kart informacyjnych

nieruchomości: gruntowych, budynkowych i lokalowych. Karty te zawierają następujące

informacje:

• data transakcji,

• nr repertorium aktu notarialnego,

• położenie nieruchomości,

• dane ewidencyjne działki, budynku, lokalu

• strony transakcji,

• rodzaj transakcji,

• informacje o nieruchomości,

• cena transakcji.

30

O dostęp do danych zawartych w Rejestrze Cen i Wartości Nieruchomości mogą

wnioskować w szczególności [19]:

• rzeczoznawcy majątkowi – na podstawie ustawy z dnia 21 sierpnia 1997r. o gospodarce

nieruchomościami (tj. Dz. U. z 2010r. Nr 102, poz. 651 ze zm.),

• uczelnie dla celów dydaktycznych – na podstawie ustawy z dnia 27 lipca 2005r. Prawo o

szkolnictwie wyższym (Dz. U. z 2005r. Nr 164, poz. 1365 ze zm.).

Dane, które udało się pozyskać do celów niniejszej pracy, dotyczą transakcji

zrealizowanych w okresie styczeń 2014 – luty 2016 na terenie pięciu dzielnic Warszawy:

Śródmieścia, Woli, Bemowa, Żoliborza i Bielan. Transakcje dotyczą nieruchomości zarówno z

rynku pierwotnego, jak i wtórnego, przy czym wykorzystane zostaną dane o transakcjach

związanych z nowymi mieszkaniami. Pozyskana baza zawiera następujące dane:

• data transakcji,

• cena transakcyjna,

• powierzchnia lokalu,

• cena jednostkowa lokalu (za 1 metr kwadratowy),

• numer działki i obrębu,

• dokładny adres,

• liczba pokoi,

• numer piętra,

• dane notariusza oraz informacja o kupującym i sprzedającym

• uwagi, zawierające nieusystematyzowane dane dotyczące umowy oraz:

- obecności garażu lub miejsca postojowego,

- obecności i powierzchni balkonu/loggii,

- udziału w prawach do gruntu,

- ewentualnym wyposażeniu mieszkania,

- rozmieszczeniu pokoi,

- liczbie sypialni, łazienek.

Niestety, nie wszystkie transakcje są opisane kompletem danych, co uniemożliwia

użycie ww. informacji (zawartych w uwagach odnośnie lokalu) do tworzenia modelu cen

mieszkań. W związku z tym jedyne informacje o mieszkaniu, które zostały użyte podczas

modelowania to:

31

• cena transakcyjna,

• powierzchnia lokalu,

• cena jednostkowa lokalu (za 1 metr kwadratowy),

• dokładny adres,

• liczba pokoi,

• numer piętra.

Cena jednostkowa lokalu jest zmienną objaśnianą modelu. Zostaną sformułowane i

przedstawione pewne hipotezy dotyczące zależności ceny za metr kwadratowy od piętra, na

którym znajduje się mieszkanie, liczby pokoi, powierzchni oraz lokalizacji. Należy

przypomnieć, że lokalizacja wiąże się z wieloma czynnikami mogącymi kształtować ceny

nieruchomości, np. bliskość centrum, dostępność komunikacji zbiorowej oraz punktów

użyteczności publicznej itd.

Mapy Google 3.3.2.

Aplikacja Mapy Google jest potężnym narzędziem oferującym wiele możliwości. Poza

dostępnymi dla zwykłych użytkowników mapami świata, informacjami o komunikacji

zbiorowej i ruchu drogowym oraz nawigacją, twórcy narzędzia przygotowali interfejs

programistyczny (API) oferujący dodatkowe możliwości, takie jak geokodowanie (ustalanie

współrzędnych geograficznych na podstawie innych danych geograficznych, np. kodu

pocztowego, ulicy i miasta) za pomocą Geocoding API, zautomatyzowane obliczanie tras i

czasów podróży pomiędzy dowolnymi lokalizacjami na świecie przy użyciu Distance Matrix

API (rys. 8) czy wizualizacja dowolnych danych na mapie za pomocą Google Maps JavaScript

API (rys. 7). Długość podróży może być określana dla ruchu pieszo, samochodem, rowerem

czy z wykorzystaniem komunikacji miejskiej.

Odwołania do interfejsu Map Google w celu uzyskania danych geolokalizacyjnych

(współrzędnych GPS) przypisanych dla danych adresów oraz wyznaczanie czasów podróży

między lokalizacjami odbywa się za pomocą żądania HTTP GET, na które serwer Google

odpowiada danymi w formacie JSON. Natomiast wizualizacja danych na mapie realizowana

jest za pomocą JavaScript w przeglądarce klienta (rys. 7), przy pobraniu pewnych danych z

serwerów Google.

32

Funkcjonalność oferowana przez Mapy Google zostanie wykorzystana do

wyznaczania odległości lokalizacji od centrum miasta, czasów dojazdu do centrum miasta

oraz do wizualizacji danych i wyników w celu ich prezentacji oraz ewentualnej dalszej analizy.

Rys. 7: Przykład zastosowania API Map Google do wizualizacji danych. Źródło [20]

Rys. 8: Przykład zastosowania API Map Google do obliczania czasu podróży (Distance Matrix API). Źródło [21]

33

Podsumowując, dzięki interfejsowi programistycznemu Map Google istnieje

możliwość określenia istotnych czynników związanych z lokalizacją nieruchomości, takich jak

odległość i czas dojazdu do dowolnie określonego centrum miasta czy bliskość innych

istotnych miejsc znajdujących się w bliższej bądź dalszej okolicy.

Punkty użyteczności publicznej 3.3.3.

Punkty użyteczności publicznej (ang. Points Of Interest - POI) są to punkty znajdujące

się najczęściej na powierzchni Ziemi, które są w pewien sposób użyteczne dla ludzi. Do POI

zalicza się takie miejsca jak:

• lokale gastronomiczne (bary, restauracje),

• punkty handlowo-usługowe (sklepy, centra handlowe, banki),

• placówki administracji publicznej (urzędy, komisariaty, ambasady),

• placówki oświaty (przedszkola, szkoły, uczelnie wyższe),

• atrakcje kulturalne i rozrywkowe (kino, teatr, centrum kultury),

• węzły komunikacyjne (przystanki, dworce, stacje metra),

• atrakcje sportowe, turystyczne, rekreacyjne

oraz wiele innych.

Punkty użyteczności publicznej są stosowane w szczególności w aplikacjach

nawigacyjnych odbiorników GPS lub systemach GIS (ang. Geographic Information System,

System Informacji Geograficznej). Podstawowe informacje opisujące POI to współrzędne

geograficzne, kategoria, nazwa i adres.

Dane o punktach użyteczności publicznej w danym mieście mogą stanowić cenną

informację o atrakcyjności lokalizacji nieruchomości, poprzez możliwość dokładnego

określenia jej położenia względem miejsc istotnych z punktu widzenia komfortu życia

mieszkańców, takich jak punkty handlowo-usługowe, placówki oświaty, węzły

komunikacyjne, atrakcje rozrywkowe itp.

Bazy danych POI są zazwyczaj dostarczane i aktualizowane przez producentów

urządzeń do nawigacji. Niestety, takie dane nie są z reguły dostępne bezpłatnie. Jednak

producenci oprogramowania AutoMapa [22] prowadzą serwis zawierający codziennie

aktualizowaną przez użytkowników systemu bazę punktów użyteczności publicznej –

34

miplo.pl [23]. Strona zawiera katalog ponad 700 tysięcy POI, spośród których ponad 53

tysiące znajduje się w Warszawie. Dane nie są możliwe do bezpłatnego pobrania ze strony,

oferowane są jedynie dla posiadaczy płatnej licencji programu AutoMapa. Jednak wszystkie

punkty użyteczności publicznej skatalogowane w serwisie miplo.pl można przeglądać na

stronie (rys. 9). Zatem można w pewien sposób użyć tych danych do określania atrakcyjności

nieruchomości.

Rys. 9: Informacja o przykładowym POI w serwisie miplo.pl.

Podsumowując, katalog punktów użyteczności publicznej dostępny w serwisie

miplo.pl został wykorzystany do określenia czynników wpływających na atrakcyjność i

wartość nieruchomości związanych z takimi aspektami jak dostępność usług (bliskość

sklepów, lokali usługowych, placówek publicznych), bliskość węzłów komunikacyjnych oraz

innych miejsc istotnych z punktu widzenia komfortu życia mieszkańców jak np. tereny

zielone.

35

Czynniki opisujące mieszkania a dostępne dane 3.3.4.

Podsumowując powyższy podrozdział należy skonfrontować składowe atrakcyjności

nieruchomości opisane w podrozdziale 3.2. z dostępnymi danymi. Spośród wielu aspektów,

które w mniejszym lub większym stopniu wpływają na ceny mieszkań do analizy należy

wybrać te, które są dokładnie opisane lub można je jednoznacznie określić dla danego lokalu.

Warto podkreślić, że czynniki związane z samym mieszkaniem lub budynkiem/inwestycją

powinny być opisane dokładnie i identycznie dla wszystkich mieszkań. Niestety, dane

transakcyjne z Rejestru Cen i Wartości Nieruchomości zawierają wiele nieuporządkowanych i

niekompletnych danych, co uniemożliwia ich użycie w procesie modelowania cen

nieruchomości.

Do analizy wykorzystane zostaną zatem następujące parametry opisujące mieszkania

przedstawione w poniższej tabeli.

Tabela 4: Parametry nieruchomości wykorzystane podczas tworzenia modelu

Atrybuty związane z mieszkaniem i inwestycją Atrybuty związane z lokalizacją

Cena lokali Odległość od centrum miasta

Cena jednostkowa (za metr kwadratowy) Czas dojazdu do centrum

Metraż Odległość od wybranych punktów

użyteczności publicznej

Liczba pokoi Dostępność komunikacji zbiorowej

Piętro

Część techniczna analizy zagadnienia 3.4.

Niniejszy podrozdział dotyczy technicznej strony modelowania, czyli sposobu

pozyskiwania danych w formie elektronicznej oraz ich agregacji i wykorzystania do obliczeń.

Różne dane są udostępniane na różne sposoby i wymagają innych sposobów ich pozyskania i

przetworzenia. Wszystkie zgromadzone informacje należało przechowywać w spójny sposób

w jednym miejscu, aby były łatwo dostępne podczas wykonywania obliczeń związanych z

tworzeniem i weryfikacją modelu.

36

Pozyskiwanie danych 3.4.1.

Dane z Rejestru Cen i Wartości Nieruchomości zostały pozyskane na podstawie

ustawy z dnia 27 lipca 2005r. Prawo o szkolnictwie wyższym, która umożliwia wnioskowanie

o dane transakcyjne przez studentów uczelni wyższych. Tak jak wspomniano wcześniej,

wykorzystane dane pochodzą z RCiWN i dotyczą transakcji zrealizowanych w okresie styczeń

2014 – luty 2016 na terenie pięciu dzielnic Warszawy: Śródmieścia, Woli, Bemowa, Żoliborza

i Bielan.

Dane dotyczące punktów użyteczności publicznej ze strony miplo.pl nie są dostępne

bezpłatnie w przystępnej formie, jednak można je przeglądać na stronie dostawcy –

umożliwiło to użycie techniki web scraping do ich pozyskania. Metoda polega na

zautomatyzowanym wysyłaniu zapytań HTTP do serwera www w celu pobrania wszystkich

potrzebnych informacji. W ramach pracy został przygotowany skrypt w języku Python, który

automatycznie przeanalizował ponad 50 000 stron www i wyodrębnił z kodu HTML

informacje o identyfikatorze, nazwie oraz kategorii POI. Unikatowy identyfikator POI został

wykorzystany do pobrania współrzędnych geograficznych odpowiadających punktowi za

pomocą żądania HTTP GET wysłanego do serwera miplo.pl:

http://www.miplo.pl/c/point.php?p=xxxxxxxx

gdzie xxxxxxxx to unikatowy ID punktu. Serwer za każdym razem zwracał dokładne

współrzędne GPS w formacie JSON, które zostały przypisane danemu punktowi i

wykorzystane w dalszym etapie do określania parametrów związanych z lokalizacją

mieszkań.

Interfejs Map Google został wykorzystany do określenia dokładnych lokalizacji

wszystkich adresów inwestycji, dla których pozyskano informacje o transakcjach. Spośród

wszystkich danych transakcyjnych wyodrębniono unikatowe adresy. Użycie API polegało na

wysyłaniu dwóch rodzajów żądań HTTP GET do serwera Google:

• https://maps.googleapis.com/maps/api/geocode/json?address=ADRES_INWES

TYCJI&key=KLUCZ_API – zwracającego współrzędne GPS (długość i szerokość

geograficzną) w formacie JSON,

• https://maps.googleapis.com/maps/api/distancematrix/json?

origins=ADRES_INWESTYCJI&destinations=ADRES_CENTRUM&key=KLUCZ_API –

37

zwracającego odległość i czas podróży między lokalizacją dane inwestycji a arbitralnie

określonym centrum miasta w formacie JSON.

Pozyskane dane zostały później wykorzystane przy określaniu atrakcyjności lokalizacji

nieruchomości.

Agregacja danych 3.4.2.

Zgromadzone dane były przechowywane w tablicy słownikowej (dictionary)

dostępnych w języku Python. Tablica składała się z elementów przypisanych kluczom –

adresom inwestycji. Każdy element tablicy składał się z następujących danych:

• lista mieszkań w danej inwestycji,

• współrzędne geograficzne danej inwestycji,

• odległość i czas podróży do centrum miasta,

• liczba punktów użyteczności publicznej w określonej odległości od inwestycji.

Natomiast każde mieszkanie było opisane przez zestaw zmiennych:

• cena całkowita,

• cena za metr kwadratowy,

• metraż,

• liczba pokoi,

• piętro.

W celu szybszego dostępu do danych podczas wykonywania regresji informacje

dotyczące wszystkich mieszkań były dodatkowo przechowywane w formie listy, która

zapewnia szybszy dostęp do danych.

Dane o punktach użyteczności publicznej przechowywane były w liście. Każdy

element zawierał następujące informacje o POI:

• identyfikator,

• nazwa,

• nazwa kategorii,

• numer kategorii,

• współrzędne geograficzne.

38

Odległości pomiędzy lokalizacjami mieszkań a wybranymi punktami użyteczności

publicznej były wyznaczane za pomocą metody Vincentego, która polega na iteracyjnym

obliczaniu przybliżonej odległości dwu punktów znajdujących się na powierzchni sferoidy

[24], z wykorzystaniem pozyskanych danych o współrzędnych geograficznych inwestycji i

obiektów.

Sformułowanie hipotez dotyczących zależności ceny 3.5.

mieszkań od czynników

Niniejszy podrozdział przedstawia hipotezy dotyczące zależności cen mieszkań od

wybranych czynników. Hipotezy zostały sformułowane na podstawie pewnych wniosków

wyciągniętych z analizy rynku mieszkań oraz opracowań zarówno bezpośrednio związanych z

zagadnieniem modelowania cen (omówionych w rozdziale drugim) jak i dotyczących

uwarunkowań przestrzennych i komunikacyjnych m. st. Warszawy. Zgodnie z ogólnym

modelem cen mieszkań przedstawionym w rozdziale 3.2.3 wartość mieszkania jest sumą

funkcji atrybutów je opisujących.

Parametry mieszkań 3.5.1.

Tabela 4 przedstawia cechy opisujące mieszkania, które dostępne w pozyskanych

danych i zostały ujęte w analizie. Cena za metr kwadratowy jest zmienną objaśnianą w

modelu, natomiast cena całkowita wynika bezpośrednio z metrażu mieszkania. Zatem

czynnikami mogącymi wpływać na wartości nieruchomości są: metraż, liczba pokoi oraz

piętro.

Przeglądając i analizując oferty deweloperów na rynku można zauważyć, że ceny

identycznych mieszkań w jednym pionie bardzo często rosną wraz z numerem piętra, na

którym lokal się znajduje. Sugeruje to, że potencjalni nabywcy rzeczywiście bardziej cenią

sobie mieszkania na wyższych piętrach. Może być to spowodowane ładniejszym widokiem z

okien takiego lokalu, większym nasłonecznieniem czy mniejszym natężeniem hałasu

dochodzącego z dziedzińca czy ulicy. Obecnie, gdy właściwie wszystkie budynki wyposażone

są w windy, mieszkanie na wyższym piętrze nie wiąże się z żadnym dyskomfortem, który

mógłby być spowodowany koniecznością pokonywania wielu stopni pieszo.

39

Poniżej przedstawiono ceny wybranych lokali w kilku realizowanych obecnie

inwestycjach mieszkaniowych. Wybrane zostały mieszkania w tych samych pionach, lecz na

różnych piętrach.

Tabela 5: Porównanie cen identycznych mieszkań na różnych piętrach.

Adres inwestycji Kasprzaka Lirowa Instalatorów

Piętro i cena

Mieszkanie 84,05 m2 Mieszkanie 55,34 m2 Mieszkanie 35,80 m2

II 690 709 zł I 453 788 zł I 243 451 zł

III 713 748 zł II 453 788 zł II 247 519 zł

IV 718 662 zł III 459 322 zł III 253 122 zł

V 737 914 zł IV 459 322 zł IV 260 193 zł

Można zauważyć, że ceny mieszkań rosną wraz z piętrem – niekoniecznie każda

kondygnacja oznacza wzrost ceny, czasami mieszkania na kilku sąsiadujących piętrach

kosztują tyle samo. Jednak widać ogólną tendencję wzrostu cen wraz z wysokością, na jakiej

lokal się znajduje.

Kolejnym czynnikiem, który może wpływać na ceny jednostkowe mieszkań, jest ich

powierzchnia. Rzeczywiście, przyglądając się ofertom deweloperów na rynku, można

zauważyć pewny trend spadkowy ceny lokalu wraz ze wzrostem jego powierzchni. Można to

intuicyjnie uzasadnić w następujący sposób: częścią wartości mieszkania jest sam komfort

jego posiadania, niezależny od dostępnej powierzchni użytkowej.

Można więc założyć, że mieszkanie kosztuje � + #$ &ł, gdzie � to wartość

hipotetycznego mieszkania o zerowej powierzchni (czyli cena „dachu nad głową”), # to cena

za każdy metr kwadratowy lokalu a $ to jego metraż. W praktyce cena mieszkania jest

określana jako iloczyn metrażu i pewnej ceny jednostkowej ! przedstawionej w ofercie i

obecnej w danych transakcyjnych. Zakładając dalej, że wartości � i # są stałe, tzn. że # jest

pewną rzeczywistą wartością każdego metra kwadratowego mieszkania, można porównać

obie ceny. Tak więc � + #$ = !$, gdzie �, # = �(�)*, w związku z tym ! =+

,+ #. Wynika

z tego, że w pewnym uproszczeniu cena jednostkowa mieszkania jest proporcjonalna od

odwrotności jego metrażu, a więc większe mieszkania kosztują mniej, co jest zgodne z

obserwowalnym na rynku trendem.

40

Tabela 6: Porównanie cen mieszkań o różnym metrażu na tych samych piętrach.

Adres inwestycji Kasprzaka Garażowa Sikorskiego

Metraż i cena jednostkowa

Mieszkania I p. Mieszkania I p. Mieszkania I p.

42,57 m2 8350 zł 41,24 m2 9100 zł 39,78 m2 8712 zł

59,26 m2 8200 zł 48,06 m2 8800 zł 46,13 m2 8650 zł

80,78 m2 8100 zł 55,34 m2 8600 zł 59,37 m2 8594 zł

91,26 m2 8040 zł 70,70 m2 8100 zł 74,92 m2 8446 zł

Zaobserwowane na rynku mieszkaniowym trendy nie do końca wpisują się w

teoretyczną zależność, aczkolwiek można przyjąć, że odwrotność metrażu jest jednym z

czynników modelującym wartości nieruchomości.

Liczba pokoi jest cechą bezpośrednio wynikającą z metrażu mieszkania, choć można

trafić na lokale (w tym samym budynku) o podobnej powierzchni różniące się liczbą pokoi,

maksymalnie o jeden. Jednak na rynku nie występuje wiele takich mieszkań, co utrudnia

analizę i dokładne określenie zależności. W związku z tym powyższy czynnik został pominięty

w modelowaniu.

Podsumowując, atrakcyjność wynikająca z parametrów mieszkań jest sumą funkcji

atrybutów je charakteryzujących zgodnie ze wzorem (4):

�� = ��!��, �� + �"�!�", ��"� + … + ��!�, �� (4)

Biorąc pod uwagę zmienne charakteryzujące mieszkanie (piętro i metraż) oraz przyjęte

zależności, atrakcyjność mieszkania wynikającą z aspektów związanych wyłącznie z samym

lokalem określona jest jako:

�� = �� + -./

, (6)

gdzie:


� – piętro, na którym znajduje się lokal,

$ – metraż lokalu,

��, ��" – współczynniki liniowej zależności.

41

Cechy lokalizacji 3.5.2.

Oczywistym jest, że w każdym większym mieście ceny mieszkań są wyższe w bliższej

odległości od jego centrum. Jest to spowodowane bliskością strategicznych lokalizacji w

mieście, lepszą dostępnością punktów użyteczności publicznej. Śródmieścia są

reprezentacyjnymi, prestiżowymi i chętnie odwiedzanymi częściami miast. Ponadto, na

wysoką cenę mieszkań zlokalizowanych w centrum wpływają ceny działek, które również

wynikają z powyższych czynników. Dodatkowo, takich działek jest niewiele, ze względu na

gęstą zabudowę centralnych części miast, co dodatkowo wpływa na ich cenę.

Jednak z punktu widzenia mieszkańców, istotna jest nie tylko odległość, ale również

czas potrzebny na dostanie się do centrum miasta przy użyciu własnego samochodu lub

komunikacji zbiorowej. Tak więc mieszkania znajdujące się blisko ważnych ciągów

komunikacyjnych czy węzłów przesiadkowych są zazwyczaj droższe niż te zlokalizowane w

gorzej skomunikowanych miejscach. Dobrze skomunikowana lokalizacja stanowi wartość

samą w sobie, gdyż pozwala na sprawniejsze poruszanie się po całym mieście, nie tylko

podróżowanie do centrum. Dlatego np. mieszkania znajdujące się na obrzeżach miast, ale

położone w bliskim sąsiedztwie stacji metra są bardziej atrakcyjne niż te bliżej centrum, ale

leżące w słabo skomunikowanej okolicy (np. oddzielone od reszty miasta trudnymi do

pokonania przeszkodami terytorialnymi takimi jak tory kolejowe).

Ludzie kupujący mieszkania cenią sobie również bliskość punktów użyteczności

publicznej takich jak sklepy, centra handlowe, lokale gastronomiczne, szkoły i przedszkola,

przychodnie czy apteki. Wynika to z zakresu typowych codziennych aktywności

mieszkańców, oczywiście poza pracą, takich jak wyprawienie dzieci do szkoły, zakupy czy

wizyta u lekarza. Ma to również odzwierciedlenie w reklamach i broszurach deweloperów,

którzy chętnie zachwalają dogodną lokalizację swoich inwestycji w odniesieniu do

omawianych punktów użyteczności publicznej.

Dodatkowo, o dogodności lokalizacji świadczy również liczba punktów usługowych w

zasięgu krótkiego spaceru, czyli kilkuset metrów. Duża liczba przydatnych miejsc na osiedlu i

w jego okolicy wpływa pozytywnie na wygodę mieszkańców. Ma to odzwierciedlenie np. w

omawianym wcześniej wskaźniku WalkScore.

Podczas tworzenia modelu zostały wykorzystane zatem następujące cechy lokalizacji

nieruchomości:

42

• odległość od centrum

• czas dojazdu do centrum

• odległość od najbliższego lokalu gastronomicznego,

• odległość od najbliższego centrum handlowego,

• odległość od najbliższej szkoły/przedszkola,

• odległość od najbliższej apteki,

• odległość od najbliższej przychodni,

• odległość od najbliższej placówki pocztowej,

• odległość od najbliższego przystanku komunikacji zbiorowej,

• liczba POI powyższych kategorii w promieniu 500 metrów.

Aby wykorzystać lokalizacje powyższych punktów w procesie modelowania, należy

znać ich dokładne położenie. O ile współrzędne geograficzne punktów użyteczności

publicznej są znane, o tyle centrum miasta jest dość szerokim pojęciem. Należy zatem

precyzyjnie określić jedną lokalizację, która będzie jak najlepiej reprezentować centrum

Warszawy.

Ważną cechą śródmieścia jest to, że skupia wiele miejsc pracy, lokali usługowych,

obiektów związanych z kulturą i rozrywką, a także jest bardzo dobrze skomunikowane – leży

przy ważnych ciągach komunikacyjnych, popularnych przystanków autobusowych,

tramwajowych i stacji metra. W powszechnym rozumieniu, centrum Warszawy stanowi

Rondo R. Dmowskiego znajdujące się u zbiegu Alei Jerozolimskich oraz ulicy Marszałkowskiej.

Wiele map wskazuje ten punkt jako środek stolicy.

Jednak ściśle określając punkt, który zostanie przyjęty za centrum miasta w modelu,

należy wziąć pod uwagę inne aspekty. W ciągu ostatnich lat zrealizowanych zostało wiele

prestiżowych inwestycji mieszkaniowych i biurowych na północny zachód od wspomnianego

Ronda Dmowskiego. Ponadto uruchomiona została II linia metra, która krzyżuje się z

pierwszą również w pewnej odległości od Ronda. Analizując fachowe opracowania

zagadnienia, takie jak Studium Komunikacyjne Śródmieścia Warszawy [25], przedstawiające

wyniki pomiarów natężenia ruchu generowanego w dni robocze przez budynki biurowe w

centrum stolicy, można stwierdzić, że centrum miasta, rozumiane jako typowy cel podróży

43

związanych z codziennymi dojazdami, do pracy jest rzeczywiście przesunięte w kierunku

północno-zachodnim od Ronda Dmowskiego.

W związku z wymienionymi faktami i czynnikami w niniejszej pracy postanowiono za

centrum m. st. Warszawy przyjąć okolice Ronda ONZ. Rondo ONZ leży przy ważnych ciągach

komunikacyjnych (Al. Jana Pawła II, ul. Świętokrzyska/Prosta, II linia metra, skrzyżowanie linii

tramwajowych), w jego bliskim sąsiedztwie powstało i nadal powstaje wiele prestiżowych

budynków mieszkalnych i biurowych. Względem tego miejsca określano odległość

poszczególnych nieruchomości rozumianą jako odległość od centrum oraz czas dojazdu do

centrum.

Wszystkie powyżej omówione aspekty związane z lokalizacją mieszkania odnoszą się

do odległości od szczególnych miejsc w mieście, takich jak centrum, punkty komunikacyjne

czy punkty użyteczności publicznej. Jednak atrakcyjność lokalizacji jest związana de facto z

bliskością omawianych miejsc. Tak więc należy określić klasę funkcji, która będzie

modelować zależność wartości mieszkań od wyżej wymienionych czynników. Należy tu

podkreślić, że czas podróży do centrum miasta może być traktowany jako odległość od

centrum, wyrażona jednostkach czasu zamiast odległości.

Przede wszystkim, atrakcyjność lokalizacji rośnie wraz ze zmniejszaniem odległości od

wybranych punktów, można więc założyć że jest do niej odwrotnie proporcjonalna. Jednak w

przypadku prostej zależności 0~�

2, atrakcyjność wynikająca z bliskości poszczególnych

kategorii istotnych miejsc rosłaby w nieskończoność wraz ze zbliżaniem się nich. Dlatego

funkcja modelująca powinna przyjąć formę 0~�

234, gdzie � jest pewną stałą, którą można

interpretować jako odwrotność hipotetycznej atrakcyjności wynikającej z bezpośredniego

położenia nieruchomości przy wybranym istotnym punkcie, czyli maksymalnej atrakcyjności

wynikającej z bezpośredniego sąsiedztwa tego punktu.

Tak więc zgodnie ze wzorem (5):

�� = ��!��, �� + �"�!�", ��"� + … + ��!�, �� (5)

atrakcyjność lokalizacji jest sumą atrakcyjności wynikających z bliskości poszczególnych

kategorii miejsc istotnych z punktu widzenia komfortu mieszkańców:

�� = ∑-56

26376

�� + 89: (7)

44

gdzie:


;� – odległość punktu �-tej kategorii,

!�– odwrotność maksymalnej atrakcyjności związanej z punktem �-tej kategorii,

��, 8 – współczynniki liniowej zależności,

� – liczba kategorii POI objaśniających wartość nieruchomości,

9: – liczba POI wybranych kategorii w promieniu 500 metrów,

� ∈ �1,2,3, … , ��.

Podsumowując wszystkie powyższe rozważania, proponowany model wskaźnika

atrakcyjności mieszkań wygląda następująco:

� = �� + -./

,+ ∑

-56

26376+ 89:

�� + � + (8)

gdzie � jest atrakcyjnością (a więc ceną) danego mieszkania, natomiast pozostałe parametry

(stałe i zmienne) zostały wyjaśnione wcześniej.

Weryfikacja postawionych hipotez 3.6.

Niniejszy podrozdział przedstawia wyniki analiz przeprowadzonych na

zgromadzonych danych w celu weryfikacji postawionych wcześniej hipotez o zależności

wartości mieszkań od wybranych czynników. Zostało sprawdzone, jak duży wpływ na cenę

lokalu ma piętro, na którym się znajduje, metraż oraz odległość od centrum miasta (Rondo

ONZ) i wybranych punktów użyteczności publicznej.

Miarą dopasowania modelu był współczynnik determinacji =" określony w

następujący sposób:

=" =∑ �>?6@>A�/B

6CD

∑ �>6@>A�/B6CD

(9)

gdzie:

0� – rzeczywista wartość zmiennej 0 dla �-tego pomiaru,

0?� – wartość zmiennej objaśnianej na podstawie modelu dla �-tego pomiaru,

0A – średnia arytmetyczna rzeczywistych wartości zmiennej objaśnianej,

� – wielkość próby danych,

45

� ∈ �1,2,3, … , ��.

Filtrowanie danych 3.6.1.

Analizy analogiczne do opisanych poniżej zostały przeprowadzone dla danych po

wstępnym odfiltrowaniu. Wybrano mieszkania znajdujące się na piętrach 2-5, aby uzyskać

zależność od kondygnacji jak najbardziej zbliżoną do liniowej (zakładając odchylenia na

skrajnych piętrach). Następnie skupiono się na mieszkaniach o podobnym metrażu (dwu- i

trzypokojowych), aby skupić się wyłącznie na zależności ceny od kondygnacji. Transakcje

filtrowano również pod względem ich wartości – wstępnie odrzucono lokale o cenach za

metr znacznie odbiegających od średniej dla danej inwestycji (pozostawiono nieruchomości

o cenach różnych o mniej niż 2 odchylenia standardowe od średniej).

Filtrowanie danych nie wpłynęło jednak prawie w żadnym stopniu na wyniki analizy i

dokładność modelowania. Przy uwzględnieniu wszystkich transakcji otrzymywano podobne

wyniki i nie gorsze parametry modelu co przy pracy na filtrowanych danych. Tak więc, jeżeli

nie zaznaczono inaczej, analizie poddawane były wszystkie pozyskane dane transakcyjne.

Zależność od numeru piętra 3.6.2.

Pierwszą z postawionych hipotez był liniowy wzrost ceny mieszkań wraz z numerem

piętra, na którym się ono znajduje. W celu weryfikacji hipotezy przeanalizowano wybrane

inwestycje, dla których pozyskano informacje o dużej liczbie transakcji (większej niż 20)

znajdujących się na różnych kondygnacjach.

Dla różnych budynków otrzymano różne wyniki. W przypadku niektórych widać

wyraźny trend wzrostu ceny wraz z piętrem (rys. 10), natomiast w przypadku innych nie da

się dostrzec tej zależności (rys. 11). Może to być spowodowane faktem, że mieszkania w

obrębie tych samych pięter znacznie się różnią (np. rozkładem pokoi, naświetleniem,

obecnością balkonu/loggii), co powoduje, że ich ceny są zróżnicowane w dużym stopniu,

przez co trend związany z numerem kondygnacji jest niemożliwy do dostrzeżenia.

46

Rys. 10: Wykres zależności ceny jednostkowej mieszkań od piętra dla inwestycji przy ul. Brylowskiej 2

(74 mieszkania). Zauważalny jest wyraźny wzrost cen za metr kwadratowy wraz z numerem piętra.

Rys. 11: Wykres zależności ceny jednostkowej mieszkań od piętra dla inwestycji przy ul.

Sowińskiego 53E (69 mieszkań). Ceny mieszkań na poszczególnych piętrach różnią się znaczniej

niż pomiędzy kondygnacjami, trudno dostrzec jakąkolwiek zależność ceny od piętra, na którym

znajduje się mieszkanie.

Po przeprowadzeniu regresji względem piętra dla poszczególnych inwestycji

otrzymano współczynniki determinacji wahające się od 0,13 do 0,85. Średnia wartość

47

współczynnika =" ważonego liczbą mieszkań w inwestycji wyniosła 0,33. Podsumowując,

zależność liniowa wartości mieszkania od kondygnacji jest wyraźna jedynie w przypadku

niektórych inwestycji.

Zależność od metrażu 3.6.3.

Kolejną hipotezą była odwrotna proporcjonalność wartości mieszkań wraz do

metrażu. W celu weryfikacji hipotezy przeanalizowano wybrane inwestycje z dużą liczbą

lokali o różnych powierzchniach użytkowych.

Dla różnych budynków otrzymano różne wyniki. W przypadku niektórych widać

wyraźny trend spadku ceny wraz ze wzrostem powierzchni użytkowej (wzrost ceny przy

wzroście odwrotności metrażu; rys. 12), natomiast w przypadku innych trudno zauważyć tę

zależność (rys. 13). Może to być spowodowane faktem, tak jak w przypadku zależności ceny

od kondygnacji, że mieszkania o podobnej powierzchni znacznie się różnią (np. rozkładem

pokoi, naświetleniem, obecnością balkonu/loggii), co powoduje, że ich ceny są zróżnicowane

w dużym stopniu, przez co trend związany z metrażem jest niemożliwy do dostrzeżenia.

Rys. 12: Wykres zależności ceny jednostkowej mieszkań od metrażu dla inwestycji przy ul.

Siedmiogrodzkiej 1 (163 mieszkania). Zauważalny jest wyraźny spadek cen za metr kwadratowy

wraz ze wzrostem powierzchni użytkowej mieszkania.

48

Rys. 13: Wykres zależności ceny jednostkowej mieszkań od metrażu dla inwestycji przy ul. Batalionów

Chłopskich 87C (116 mieszkań). Ceny mieszkań o podobnych powierzchniach różnią się znaczniej niż w

zależności od metrażu, trudno dostrzec jakąkolwiek zależność ceny od powierzchni użytkowej lokalu.

Po przeprowadzeniu regresji względem odwrotności metrażu dla poszczególnych

inwestycji otrzymano współczynniki determinacji wahające się od 0,09 do 0,74. Średnia

wartość współczynnika =" ważonego liczbą mieszkań w inwestycji wyniosła jedynie 0,26.

Podsumowując, zależność liniowa wartości mieszkania od kondygnacji jest wyraźna jedynie

w przypadku niektórych inwestycji.

Zależność od piętra i metrażu 3.6.4.

Następnym krokiem w analizie zależności było przeprowadzenie regresji z

wykorzystaniem dwóch zmiennych objaśniających wartość (atrakcyjność) lokalu: kondygnacji

oraz metrażu. Zostanie więc przyjęta zależność wynikająca ze wzorów (7) i (8):

� = �� + �� + + � = �� + -./

,+ �� + � + (10)

gdzie:

� – atrakcyjność mieszkania,


49



$ – metraż lokalu,

��, ��" – współczynniki liniowej zależności.

Wartości współczynników ��, ��" oraz �� (przyjęta w tym momencie jako stała) zostaną

wyznaczone poprzez zastosowanie regresji liniowej.

Oczywiście, tak jak w poprzednich przypadkach, dla różnych budynków otrzymano

różne wyniki. Jednak tym razem współczynniki determinacji przyjmowały wartości z zakresu

od 0,16 do 0,91, natomiast średnia wartość =" ważona liczbą mieszkań w inwestycji wyniosła

0,58.

Zależność wartości mieszkania od piętra i metrażu postanowiono wykorzystać w

modelu, przyjmując stałe współczynniki proporcjonalności ceny do kondygnacji i

odwrotności powierzchni użytkowej �� i ��". Oba współczynniki zostały zdefiniowane jako

średnie wartości takich współczynników wyznaczonych za pomocą regresji liniowej dla

wszystkich inwestycji, ważone liczbą mieszkań w każdym budynku. Wartości omawianych

współczynników wyniosły:

�� = 136,74H&łI,

��" = 31421H&łI

i takie zostały przyjęte do dalszej analizy, czyli weryfikacji zależności cen lokali od

parametrów związanych z lokalizacją.

Zależność od odległości od centrum 3.6.5.

Kolejną postawioną hipotezą była zależność ceny od odwrotności odległości od

centrum. W celu weryfikacji hipotezy przeanalizowano ustalone średnie ceny mieszkań dla

wszystkich omawianych inwestycji.

Pierwszym krokiem było ustalenie pewnej ceny bazowej mieszkania dla każdego

budynku. Dokonano tego na trzy sposoby i wyznaczono trzy różne wartości:

1. średnia arytmetyczna cen wszystkich mieszkań w obrębie danej inwestycji (rys. 14),

50

2. średnia arytmetyczna cen wszystkich mieszkań z uwzględnieniem korekty wynikającej

z założonej wcześniej zależności ceny od piętra i metrażu (rys. 15).

3. stała będąca wynikiem przeprowadzonej regresji względem kondygnacji i metrażu dla

każdej inwestycji z osobna (tylko dla wybranych inwestycji, dla których

przeprowadzono regresję) (rys. 16).

Zgodnie z hipotezą, wartość (atrakcyjność) mieszkania wynosi � =7

23J+ #, gdzie !,

K i # to pewne stałe, ; to odległość lokalizacji od centrum (Ronda ONZ), natomiast � to

atrakcyjność, (czyli cena jednostkowa) lokalu.

Dla wyznaczonych wartości bazowych cen mieszkań we wszystkich lokalizacjach

dokonano regresji liniowej względem zmiennej objaśniającej &, gdzie & =�

23J, nazywaną

bliskością centrum, natomiast zmienną objaśnianą była oczywiście cena za metr

kwadratowy. Aby dobrać wartość stałej K maksymalizującej współczynnik determinacji =",

wykorzystano narzędzie do optymalizacji (solver z pakietu SciPy dla języka python,

minimalizacja metodą gradientu sprzężonego [28]).

Rys. 14: Wykres zależności średniej ceny jednostkowej mieszkań we wszystkich lokalizacjach

(obliczonej wg sposobu 1) w zależności od odległości do centrum. Zauważalny jest spadek

wartości lokali wraz z oddalaniem się od centrum.

51

Rys. 15: Wykres zależności średniej ceny jednostkowej mieszkań we wszystkich lokalizacjach

(obliczonej wg sposobu 2) w zależności od odległości do centrum. Wykres różni się niewiele od

poprzedniego

Rys. 16: Wykres zależności średniej ceny jednostkowej mieszkań w wybranych lokalizacjach

(obliczonej wg sposobu 3) w zależności od odległości do centrum. Widoczna jest nieznaczna

różnica względem poprzednich wykresów.

52

Po przeprowadzeniu regresji liniowej względem bliskości centrum, dla bazowych cen

mieszkań w inwestycjach wyznaczonych na 3 sposoby, wyznaczonych otrzymano wyniki,

które naniesiono na powyższe wykresy w postaci krzywych (rys. 14, 15 i 16):

1. � = 6207 +MNOPQQ

23�PO, =" = 0,41

2. � = 5317 +SSTPQQ

23"Q�, =" = 0,35

3. � = 4894 +WMMTQQ

23"TW, =" = 0,49

Można zauważyć, że najlepszy wynik daje uwzględnienie cen bazowych mieszkań

wynikających z regresji względem kondygnacji i metrażu.

Po przeprowadzeniu analogicznej analizy z uwzględnieniem czasu podróży

samochodem do centrum zamiast odległości od centrum otrzymano następujące wyniki:

1. � = 6265 +�QW"QQQ

2@�PO, =" = 0,35

2. � = 5278 +�QSOQQQ

2@"Q�, =" = 0,29

3. � = 4669 +�PQOQQQ

2@"TW, =" = 0,44

Warto zauważyć, że otrzymano ujemne wartości współczynników w mianowniku, co jest

niezgodne z postawioną wcześniej hipotezą. Jednak w związku z faktem, że błąd modelu jest

większy w przypadku uwzględnienia czasu podróży do centrum, postanowiono przyjąć do

dalszej analizy założenie o zależności ceny od bliskości centrum.

Zależność od odległości od POI 3.6.6.

Kolejna postawiona hipoteza mówi, że odległość nieruchomości od wybranych

kategorii punktów użyteczności publicznej wpływa w podobny sposób na jej atrakcyjność.

Sprawdzono, która kategoria POI po dołączeniu do modelu (razem z odległością od centrum)

(zgodnie ze wzorem (7) - �� = ∑�56

26376+ 89�

�� ) pozwala osiągnąć większy współczynnik

determinacji modelu. Przy dołączaniu do modelu wartości mieszkań wybranych kategorii

punktów użyteczności publicznej otrzymano następujące wartości wskaźników =":

• najbliższy lokal gastronomiczny - =" = 0,51,

• najbliższe centrum handlowe - =" = 0,54,

• najbliższa szkoła/przedszkole - =" = 0,56,

53

• najbliższa apteka - =" = 0,53,

• najbliższa przychodnia - =" = 0,51,

• najbliższa placówka pocztowa - =" = 0,53,

• najbliższy przystanek komunikacji zbiorowej - =" = 0,58.

Wynika z tego, że w największym stopniu na wygodę mieszkańców wpływa bliskość

przystanków komunikacji miejskiej. Ujęcie w modelu odległości od najbliższego przystanku

oraz najbliższej szkoły/przedszkola pozwoliło uzyskać współczynnik determinacji =" = 0,61.

Następnie przeanalizowano dodatkowy wpływ liczby punktów użyteczności

publicznej wyżej wymienionych kategorii w promieniu 500 metrów na atrakcyjność

mieszkań. Włączenie do modelu omawianej miary atrakcyjności lokalizacji pozwoliło

nieznacznie zwiększyć dokładność modelu – wskaźnik =" osiągnął wartość 0,65.

Podsumowując, wyznaczony model atrakcyjności lokalizacji ma następującą postać:

� = 4384 +PMPMQQQ

2D3"WP+

�PTSQQ

2/3��S+ 18.9 ∗ 9: (11)

gdzie:

� – atrakcyjność (cena) lokalu,

;� – odległość centrum w metrach,

;" – odległość najbliższego przystanku komunikacji miejskiej w metrach,

9: – liczba POI wszystkich wybranych kategorii w promieniu 500 metrów.

Należy przypomnieć, że powyższy model powstał na skutek analizy cen bazowych mieszkań

w wybranych inwestycjach (z liczbą lokali większą niż 20 – wg dostępnych danych

transakcyjnych). Ceny bazowe zostały wyznaczone poprzez regresję względem numeru

kondygnacji i metrażu wszystkich mieszkań w obrębie wskazanych inwestycji.

Regresja dla wszystkich mieszkań 3.6.7.

Następnym etapem analizy było uwzględnienie wszystkich dostępnych danych

transakcyjnych w regresji. Przyjęto hipotezy o zależności cen lokali od:

• piętra,

• metrażu,

• odległości od centrum,

54

• odległości od najbliższego przystanku komunikacji miejskiej,

• liczby punktów użyteczności publicznej w okolicy 500 metrów.

Przyjęto następujący model cen mieszkań:

� = �� + -./

,+

-5D

2D37D+

-5/

2/37/+ 89: + � + (12)

gdzie:

� – atrakcyjność (cena) lokalu,


$ – metraż mieszkania,

;� – odległość inwestycji od centrum w metrach,

;" – odległość budynku od najbliższego przystanku komunikacji miejskiej w metrach,

9: – liczba POI wszystkich wybranych kategorii w promieniu 500 metrów od budynku,

��, ��", ��, ��, !�, !", 8, � – stałe,

– błąd modelu.

Współczynniki modelu związane ze zmianą ceny w zależności od kondygnacji i metrażu

zostały wyznaczone wcześniej:

!�� = 136,74 H&łI,

!�" = 31421 H&łI.

Wyznaczone wartości przyjęto jako stałe dla wszystkich mieszkań i inwestycji. Natomiast

współczynniki związane z lokalizacją (odległością od centrum i położeniem względem

punktów użyteczności publicznej) zostały ponownie wyznaczone za pomocą regresji liniowej

i solvera.

W wyniku analizy wszystkich mieszkań z próby, która liczyła 7158 transakcji,

otrzymano następujący model atrakcyjności (wartości) nieruchomości:

A = 4354 + 136,74 � +T�N"�

,+

�QSQQQQQ

2D3"O�+

TPW�QQ

2/3�QP+ 15,1 ∗ 9: (13)

55

Współczynnik determinacji powyższego modelu osiągnął wartość =" = 0,76.

Rys. 17: Wizualizacja błędów modelowania dla poszczególnych inwestycji na mapie. Wielkość punktu

jest proporcjonalna do pierwiastka 4 stopnia z liczby transakcji zarejestrowanych dla danej lokalizacji.

Kolor czerwony oznacza niedoszacowanie, a niebieski – przeszacowanie wartości lokalu przez model.

Natężenie barwy oznacza natomiast skalę niedoszacowania/przeszacowania wyznaczonej jako średni

względny błąd modelu dla wszystkich mieszkań z danej inwestycji.

Próba korekty modelu 3.6.8.

Przedstawiając średni względny błąd modelowania dla wszystkich inwestycji (rys. 17)

można dostrzec pewne zbiorowiska inwestycji niedoszacowanych i przeszacowanych, przy

czym tych pierwszych jest więcej. Rozbieżność cen modelowanych i rzeczywistych można

próbować wyjaśniać na wiele sposobów. Niedoszacowanie mieszkań w dzielnicy Żoliborz

może być spowodowana prestiżem tej dzielnicy, natomiast przeszacowanie lokali w

okolicach Odolan (część dzielnicy Wola) może wynikać z niższych cen działek znajdujących się

na terenach pokolejowych. Niedoskonałość przedstawionego sposobu szacowania cen może

56

być spowodowana różnicami w jakości budynków budowanych przez różnych deweloperów,

ponieważ z powodu braku odpowiednich danych niemożliwe było określenie czynników

związanych ze standardem poszczególnych inwestycji mieszkaniowych.

Jednak obserwując wizualizację można zauważyć, że nieruchomości osiągają wyższe

średnie ceny, gdy są zlokalizowane w większych skupiskach. Może to być spowodowane tym,

że pojedynczy nowy blok postawiony w wolnym miejscu pomiędzy starszymi budynkami nie

jest tak atrakcyjny jak nieruchomość znajdująca się na nowym osiedlu, otoczona

nowoczesnymi, ładnymi budynkami. Dobrym przykładem jest ulica Powstańców Śląskich,

gdzie znajdują się zarówno nowe osiedla o zwartej zabudowie jak i pojedyncze nowe budynki

umieszczone na terenie starych osiedli. Z rysunku 17 wynika, że model niedoszacował cen

mieszkań znajdujących się w budynkach na terenie nowego osiedla, natomiast lokale z

inwestycji umiejscowionych pośród starszych budynków mają w rzeczywistości ceny niższe

niż wynika to z estymacji.

Postanowiono zweryfikować powyższą hipotezę poprzez określenie miary opisującej

najbliższe otoczenie nieruchomości i włączenie jej do modelu cen. Założono, że budynek

znajduje się w obrębie nowego osiedla, jeżeli liczba nowych bloków w promieniu 200

metrów jest większa niż jeden. Za nowe budynki przyjęto wszystkie nieruchomości, których

dotyczyły dane transakcyjne pozyskane i analizowane w niniejszej pracy. Zmienną logiczną

określającą otoczenie nieruchomości (nowoczesne/stare) zdefiniowano jak powyżej i

włączono do opracowanego wcześniej modelu (wzór 8). W celu wyznaczenia parametrów i

dokładności modelu przeprowadzono analogiczną procedurę jak poprzednio. Tak więc

założono, że cena (atrakcyjność) mieszkania jest opisana wzorem:

� = �� + -./

,+

-5D

2D37D+

-5/

2/37/+ 89: + Z[ + � + (14)

gdzie [ to zmienna logiczna opisująca sąsiedztwo nieruchomości, a Z to stała.

Współczynnik determinacji zaktualizowanego modelu osiągnął wartość =" = 0,77, tak więc

włączenie kolejnego parametru nie przyniosło widocznej poprawy. W związku z tym uznano

opisany parametr związany z otoczeniem budynku za nieistotny i za ostateczną wersję

zależności opisującej ceny mieszkań przyjęto wzór (10) z wyznaczonymi współczynnikami

(11).

57

Wnioski z analizy 3.7.

Udało się zgromadzić, przetworzyć i przeanalizować dane transakcyjne dla ponad 7

tysięcy nieruchomości znajdujących się w 5 dzielnicach Warszawy. Przeprowadzona analiza

pozwoliła zweryfikować pewne hipotezy związane z zależnością cen mieszkań na rynku

pierwotnym. Na zgromadzonych danych udało się potwierdzić hipotezy przedstawione w

rozdziale 3.5. Udowodniono, że na atrakcyjność i cenę jednostkową mieszkania ma wpływ

piętro, na którym się znajduje, metraż, odległość od centrum miasta, odległość najbliższego

przystanku komunikacji miejskiej oraz liczba punktów użyteczności publicznej w najbliższej

okolicy. Hipoteza o wpływie sąsiedztwa nieruchomości (nowe/stare osiedle) została

odrzucona.

58

4. Podsumowanie

Niniejszy rozdział zawiera podsumowanie przeprowadzonych prac. Przedstawione

zostały konkluzje wynikające z wykonanego badania zagadnienia modelowania cen

nieruchomości. Zaproponowano również dalsze możliwe ścieżki pracy nad zagadnieniem.

Podsumowanie przeprowadzonych prac 4.1.

Celem pracy było zapoznanie się z rynkiem mieszkań, określenie i analiza cech

wpływających na atrakcyjność mieszkań oraz stworzenie i weryfikacja modelu

matematycznego opisującego ceny mieszkań uwzględniającego wybrane parametry

nieruchomości.

Przeanalizowano sytuację na rynku nieruchomości w Polsce i dokonano przeglądu

literatury i opracowań dotyczących zagadnienia modelowania cen mieszkań zarówno na

rynku polskim jak i na rynkach zagranicznych. Zwrócono uwagę na istniejące rozwiązania

automatyzujące proces analizy danych, z których zostały zaczerpnięte pewne inspiracje.

Następnie przedstawione zostały teoretyczne podstawy hedonicznych indeksów cen

mieszkań oraz modelowania za pomocą regresji. Przeanalizowane zostały czynniki

wpływające na komfort życia mieszkańców, a co za tym idzie na atrakcyjność nieruchomości,

związane z samym mieszkaniem oraz jego lokalizacją. Opisano sposoby pozyskiwania i

gromadzenia danych z różnych źródeł oraz skonfrontowano określone czynniki

determinujące ceny mieszkań z informacjami dostępnymi w zebranych danych. Poprzez

analizę danych udało się potwierdzić pewne hipotezy dotyczące cech nieruchomości

wpływających na ich cenę. Cel pracy został osiągnięty.

Konkluzje 4.2.

W rozdziale dotyczącym przeglądu istniejącego stanu wiedzy określono

nieopracowaną stronę zagadnienia. W niniejszej pracy, w przeciwieństwie do innych

opracowań tematu, zwrócono większą uwagę na aspekty związane z lokalizacją mieszkań i

59

informacjami, które są możliwe do wydobycia przy użyciu istniejących technologii. Udało się

potwierdzić wpływ położenia nieruchomości na mapie miasta na ich ceny rynkowe.

Zwrócono również uwagę na główne czynniki związane z samymi lokalami, tj. wielkość

mieszkania oraz kondygnację, na którym się znajduje. Wyznaczony model wartości

nieruchomości cechował się zadowalającym współczynnikiem determinacji.

Możliwości dalszej analizy tematu 4.3.

Zagadnienie modelowania cen mieszkań nie zostało wyczerpane w niniejszej pracy,

również biorąc pod uwagę określony zakres badania – rynek nowych mieszkań w Warszawie.

Pierwszym – i najważniejszym – powodem jest fakt, że udało się pozyskać dane

transakcyjne wyłącznie dla części miasta. Informacje o transakcjach z całej stolicy dałyby

szerszy pogląd na sytuację na warszawskim rynku oraz z pewnością dokładniejsze wyniki

analizy. Prawdopodobnie udałoby się zauważyć więcej lokalizacji, w których mieszkania są

droższe bądź tańsze niż wynikałoby to z modelu oraz wyciągnąć pewne wnioski, np. związane

z położeniem nieruchomości po obu stronach Wisły. Gdyby dane z Rejestru Cen i Wartości

Nieruchomości posiadały więcej uporządkowanych informacji na temat mieszkań, np.

obecności miejsca parkingowego czy balkonu, być może udałoby się stworzyć dokładniejszy

model uwzględniający czynniki nie wzięte pod uwagę przy wykonanej analizie.

Ponadto, można by próbować określać inne czynniki związane z lokalizacją

nieruchomości determinujące ich cenę, takie jak chociażby położenie względem terenów

zielonych czy innych typowych celów podróży mieszkańców Warszawy, jak np. dzielnica

biurowa na Mokotowskim Służewcu, gdzie pracuje obecnie niemal 100 tysięcy osób [26].

Należy jednak podkreślić, że bardzo istotnym dla otrzymania jak najbardziej rzetelnych

wyników analizy jest możliwość analizy jak największej ilości danych dotyczących transakcji z

całej Warszawy.

60

Bibliografia:

[1] Trader21 (2014), „Rzut okiem na rynek nieruchomości”, http://independenttrader.pl

(Dostęp: 13 września 2016)

[2] A. Prajsnar (2014), „Ceny mieszkań wczoraj i dziś”, http://nf.pl (Dostęp: 13 września 2016)

[3] M. Gawin (2016), „Raport z rynku mieszkań – styczeń 2016”, http://www.bankier.pl


[4] M. Gawin (2016), „Raport z rynku mieszkań – luty 2016”, http://www.bankier.pl (Dostęp:

13 września 2016)

[5] REAS (2016), „Rynek mieszkaniowy w Polsce, II kwartał 2016”, http://www.reas.pl/


[6] J. Kolbe, H. Wuestemann (2015), „Estimating the Value of Urban Green Space: A hedonic

Pricing Analysis of the Housing Market in Cologne, Germany”, SFB 649: Economic Risk

Discussion Paper 2015-002

[7] G. Hu, J. Wang, W. Feng (2013), „Multivariate Regression Modeling for Home Value

Estimates with Evaluation using Maximum Information Coefficient”, Software Engineering,

Artificial Intelligence, Networking and Parallel/Distributed Computing, s. 69-81

[8] Iain R. Lake, Andrew A. Lovett, Ian J. Bateman, Brett Day (2000), „Using GIS and large-

scale digital data to implement hedonic pricing studies”, International Journal of

Geographical Information Science, s. 521-541

[9] J. Ottensmann, S. Payton, J. Man (2008), „Urban Location and Housing Prices within a

Hedonic Model”, Journal of Regional Analysis and Policy 38, s. 19-35

[10] R. Zbyrowski (2010), „Szacowanie wartości nieruchomości na podstawie modeli

ekonometrycznych”, Equilibrium t. 4 nr 1 s. 241-252

[11] E. Tomczyk, M. Widłak (2010), „”Konstrukcja i własności hedonicznego indeksu cen

mieszkań dla Warszawy”, Bank i Kredyt 41 (1), s. 99-128

[12] https://www.WalkScore.com (Dostęp: 13 września 2016)

[13] https://en.wikipedia.org/wiki/Walk_Score (Dostęp: 13 września 2016)

61

[14] https://www.szybko.pl/ (Dostęp: 13 września 2016)

[15] https://ceny.szybko.pl/wycena-nieruchomosci (Dostęp: 13 września 2016)

[16] https://pl.wikipedia.org/wiki/Regresja_(statystyka) (Dostęp: 13 września 2016)

[17] https://pl.wikipedia.org/wiki/Regresja_liniowa (Dostęp: 13 września 2016)

[18] https://en.wikipedia.org/wiki/Automated_valuation_model (Dostęp: 13 września 2016)

[19] http://www.mapa.um.warszawa.pl/BGIK/RCiWN.html (Dostęp: 13 września 2016)

[20] https://github.com/googlemaps/js-marker-clusterer (Dostęp: 13 września 2016)

[21] http://www.programmableweb.com/news/calculate-distances-intelligently-google-

distance-matrix-api/2011/07/22 (Dostęp: 13 września 2016)

[22] http://www.automapa.pl/ (Dostęp: 13 września 2016)

[23] http://www.miplo.pl/ (Dostęp: 13 września 2016)

[24] https://en.wikipedia.org/wiki/Vincenty's_formulae (Dostęp: 13 września 2016)

[25] A. Brzeziński, M. Dobrosielski, T. Dybicz i in. (2009), „Studium komunikacyjne

Śródmieścia Warszawy w związku z planowanymi zmianami zagospodarowania

przestrzennego”

[26] http://natemat.pl/8081,sluzewiec-miejsce-w-ktorym-jest-najwiecej-samochodow-w-

polsce-i-najmniej-miejsc-do-parkowania (Dostęp: 13 września 2016)

[27] https://pl.wikipedia.org/wiki/Wsp%C3%B3%C5%82czynnik_determinacji (Dostęp: 13

września 2016)

[28] https://pl.wikipedia.org/wiki/Metoda_gradientu_sprzężonego (Dostęp: 13 września

2016)

POLITECHNIKA WARSZAWSKA - staff.elka.pw.edu.plstaff.elka.pw.edu.pl/~mkamola/Czeczko16.pdfPraca...

Documents

Transcript of POLITECHNIKA WARSZAWSKA - staff.elka.pw.edu.plstaff.elka.pw.edu.pl/~mkamola/Czeczko16.pdfPraca...