Data Skeptic

Data Skeptic

Categories

metadata
miniepisode
advertising
medicine
general
wikipedia
art
financial
gaming
statistics
skepticism
data science
socialweb
love
econometrics
deep neural networks, image recognition
data viz
privacy
open data
psychology
audio
data philanthropy
measurement
gmo
civic data science

Archives

April
March
February
January

December
November
October
September
August
July
June
May
April
March
February
January

December
November
October
September
August
July
June
May
April
March
February
January

December
November
October
September
August
July
June
May
April
March
February
January

December
November
October
September
August
July
June
May
April
March
February
January

December
November
October
September
August
July
June
May
April
March
February
January

December
November
October
September
August
July
June
May
April
March
February
January

December
November
October
September
August
July
June
May
April
March
February
January

December
November
October
September
August
July
June
May
April
March
February
January

December
November
October
September
August
July
June
May
April
March
February
January

December
November
October
September
August
July
June
May

Syndication

Fri, 18 March 2016

[MINI] The Elbow Method

Certain data mining algorithms (including k-means clustering and k-nearest neighbors) require a user defined parameter k. A user of these algorithms is required to select this value, which raises the questions: what is the "best" value of k that one should select to solve their problem?

This mini-episode explores the appropriate value of k to use when trying to estimate the cost of a house in Los Angeles based on the closests sales in it's area.

Direct download: the-elbow-method.mp3
Category:general -- posted at: 8:00am PDT