Dạo này IMDB có vẻ là xu hướng.. Tặng ae đam mê data bự ftp://ftp.fu-berlin.de/pub/misc/movies/database/ Éo hiểu sao rất nhiều content unique, ko thấy trên Google Cắt 10k dòng đầu Head -10000 source.list > source.10000.txt
Bạn nào crawl được toàn bộ IMDB không nhỉ? Báo giá rẻ rẻ giúp mình với Lưu ý là toàn bộ nhé: phim, tóm tắt phim, năm sản xuất, diễn viên, trivia, quotes, image links, ... và lưu vào DB MySQL.
thằng IMDB nó cung cấp toàn bộ data trên AWS S3 http://www.imdb.com/interfaces Bác nào cần thì nghiên cứu mà tải về. Mình đọc qua thấy lằng nhằng quá nên lười. Note: Cái này là tải về mất phí, cơ mà rẻ lắm "$0.090 per GB". Chắc tải hết về mất tầm 1-2USD thôi.