Lờ mờ em cảm nhận được điều này có bác nói ra chuẩn được điều đó. Thay vì gạch đá chê bai như những chỗ khác, ở đây lại tư vẫn và hỗ trợ. Các bác trên nói chuẩn, dù sao cần phải có kinh tế tối thiểu duy trì cuộc sống chứ k nên tất tay nếu chưa có lực.
Cảm ơn bạn nhé, mình chắc chắn sẽ ko buil rộng rãi rồi, còn số ít thì mình nghĩ chắc sẽ ko ảnh hưởng nhiều bạn ạ --- Double Post Merged, Oct 27, 2021, Original Post Date: Oct 27, 2021 --- cảm ơn bạn ạ, mong nhận được hồi âm sớm từ bạn bạn nhé --- Double Post Merged, Oct 27, 2021 --- Trước đây thì mình làm những công việc như mình kể ở trên đấy bạn ạ, cuối năm vừa rồi đến giờ thì mình sống dựa vào tiền bán thuê tool nhưng lát đát và giờ team mình từng tham gia ko phát triển nửa, mình củng tính đi làm thực sự thì mình ko ngại công việc gì bên ngoài cả, nhưng giờ vẫn đang dịch và con mình chưa đi học nên nó ở nhà với mình, vợ mình thì bán ngoài chợ thu nhập bấp bênh củng chỉ đủ trả tiền nhà và lo ăn uống cho gia đình, hôm được hôm mất bạn ạ, chứ ko mình đi phụ hồ ngày củng hơn 300k rồi ban đêm về tranh thủ làm thêm, cảm ơn bạn góp ý nhé
Nếu cần giúp khi xin việc cứ mạnh dạn inbox mình, ngày nào cũng đọc vài chục cái cv dev c# nên cũng có chút kinh nghiệm có thể chia sẻ về cách viết cv, cách làm ở các cty, những câu họ hay hỏi, họ thích gì ghét gì.... Cái nghề auto này, muốn ăn chắc thì cần phải có cái gì đó ổn định về tiền bạc phía dưới mới nuôi được, không là cuối tháng chỉ cần nhìn bill tiền server thôi cũng mệt mỏi rồi.
Chắc bạn mới vào đây nên thấy thế..... trong này toàn mấy ông già với nhau còn sung sức đâu mà troll nhau như mấy bạn trẻ nữa.
Tóm lại thì thớt cần tìm việc ổn định hay việc freelancer? Nếu freelance thì crawl cho anh 1 web này: Lyrics.com Anh đã có toàn bộ link artist của web trên (khoảng 135K links), lưu trong 1 file text như sau: Yêu cầu: em parse từng link artist trong danh sách, lấy thông tin artists và songs rồi lưu vào file csv, mỗi field cách nhau bằng tab (2 file csv: 1 file danh sách artist, 1 file danh sách songs). Có khoảng 4 hoặc 5 triệu songs. Kinh phí: 1triệu VND. Giá này anh tính theo ước lượng của anh. Nếu crawl chuyên nghiệp thì với yêu như trên chỉ code khoảng 2 - 3 tiếng là xong. Nếu thấy giá không phù hợp thì bỏ qua. Anh không cần lấy code, chỉ lấy data. Em crawl xong send anh data là được. Data crawl rồi em thích bán cho người khác cũng không sao. Site này cũng không chặn request. Anh vừa test thử request 1590 url artist, sleep 1s/requets, tất cả request đều thành công --> không có vấn đề gì khó về kỹ thuật. (xem hình) Đồng ý thì rep anh, anh sẽ đưa danh sách field cụ thể cần lấy. Thông tin trao đổi cứ trực tiếp trên post này, khỏi cần ib mất công.
--- Double Post Merged, Oct 27, 2021, Original Post Date: Oct 27, 2021 --- dạ e cảm ơn anh ạ, để e xem qua nha anh, nếu trong khả năng thì e rep anh sớm ạ
Dạ anh cho e hỏi là tấc cả các link artist dồn vào 1 file csv luôn đúng ko anh, có 2 field như trong hình đúng ko vậy anh
@Ducvu cái anh đưa cho em là 1 file có danh sách các url đến các artist như anh đã nói ở trên (135K links, mỗi link 1 dòng) Em sẽ code & lấy data rồi đưa lại cho anh là 2 file gồm: - File thông tin artist: các field cụ thể cần lấy anh sẽ liệt kê ra sau (nếu em đồng ý làm), đại khái như: artist_id, tên artist, link ảnh artist, ... (các field này đều có sẵn trên page của artist) - File thông tin bài hát: các field cụ thể sẽ liệt kê sau: song_id, lyrics(nội dung bài hát), độ dài bài hát (duration), artist_id, năm sáng tác, Written by, video_id, tên album, link ảnh album .... (các field này đều có sẵn trên page của 1 bài hát) Trường hợp file crawl về lớn quá em có thể chia nhỏ ra tùy ý, tiện cho em code là được. Miễn sao đúng format anh đưa để anh có thể import database theo đúng cấu trúc. --- Double Post Merged, Oct 27, 2021, Original Post Date: Oct 27, 2021 --- haha vô tư em ơi, chủ yếu anh đưa việc ra cho thớt có việc làm thôi --- Double Post Merged, Oct 27, 2021 --- @Ducvu em ước lượng luôn thời gian crawl, cần bao lâu? Anh kì vọng 2 tuần là crawl xong. Anh có thể hỗ trợ em thêm 500K chi phí cho việc thuê VPS để crawl (hoặc chi phí điện + hao mòn laptop nếu em crawl = laptop của em)
Dạ ok anh, e đồng ý anh ạ, a có thể nêu ra các field cần lấy được ko ạ, còn thiếu fied nào ko vậy anh
kèo thơm, site ấy rate limit tầm 10k rpm mới nhả 403. 1 ngày anh nhả tầm chục job như này lên đây là ae ấm no
@Ducvu đây em nhé. 1. Thông tin artist cần lấy: artist_id, artist_name, artist_bio, artist_img_url Ví dụ 1 dòng trong file text của anh: artist.php?name=madonna&aid=64565 Khi code em phải dổi lại thành: https://www.lyrics.com/artist.php?name=madonna&aid=64565&o=1 Và lấy ra các thông tin như sau: + artist_id = 64565 + artist_name = Madonna + artist_bio = "Madonna (born Madonna Louise Ciccone /tʃɪˈkoʊneɪ/ chi-KOH-nay; August 16, 1958) is an American singer, songwriter, actress, director, dancer and entrepreneur. She has sold more than 300 million records worldwide and is recognized as the best-selling female recording artist of all time by Guinness World Records. Considered to be one of the "25 Most Powerful Women of the Past Century" by Time for being an influential figure in contemporary music, she is known for continuously reinventing both her music and image, and for retaining a standard of autonomy within the recording industry. Critics have praised her diverse musical productions which have also been known to induce controversy." + artist_img_url = https://www.lyrics.com/images/artist/64565_madonna.png 2. Thông tin các bài hát cần lấy: Từ link artist ở trên (https://www.lyrics.com/artist.php?name=madonna&aid=64565&o=1), em sẽ thấy artist này có nhiều bài hát. Em cần lấy thông tin từng bài hát như sau: song_id, song_name, song_url, song_intro, song_lyrics, song_duration, song_image_url, song_genre, song_style, artist_id, written by, album_name, album_id, album_year, album_url Ví dụ 1 bài hát đầu tiên có link là: https://www.lyrics.com/lyric/26022337/Madonna/4+Minutes Em cần lấy ra các thôing tin sau: + song_id = 26022337 + song_name = 4 Minutes + song_url = https://www.lyrics.com/lyric/26022337/Madonna/4+Minutes + song_intro = ""4 Minutes" is a song by American singer Madonna from her eleventh studio album Hard Candy (2008), featuring vocals by American singers Justin Timberlake and Timbaland. It was released as the lead single from the album on March 17, 2008, by Warner Bros. Records. According to Madonna, the song is about saving the environment and "having a good time while we are doing it". She also cited the song as the inspiration for the documentary I Am Because We Are (2008). The song was recorded at Sarm West Studios, in London, while the mixing of the track was finished at The Hit Factory studio, in New York City. Sound engineer Demo Castellon first worked on the vocals and then on the beats, while the synths were composed by Timbaland and Danja. An uptempo dance-pop song with an urban and hip hop style, "4 Minutes" incorporates Timbaland's characteristic bhangra beats and the instrumentation used in the song includes brass, foghorns and cowbells. The lyrics carry a message of social awareness, inspired by Madonna's visit to Africa and the human suffering she witnessed in the continent." + song_lyrics = " I'm outta time and All I got is four minutes (freaky, freaky), four minutes aye I'm outta time and All I got is four minutes (freaky, freaky), four minutes aye I'm outta time and All I got is four minutes (freaky, freaky), four minutes aye (four, four) I'm outta time and All I got is four minutes (freaky, freaky), four minutes aye (four, four) I'm outta time and All I got is four minutes (freaky, freaky), four minutes aye (four, four) I'm outta time and All I got is four minutes (freaky, freaky), four minutes aye (four, four) I'm outta time and All I got is four minutes (freaky, freaky), four minutes aye (four, four) I'm outta time and All I got is four minutes (freaky, freaky) (four, four) Come on, ah Yeah, ha Break down Come on Hey, uh Come on Madonna, break it Come on boy I've been waiting for somebody To pick up my stroll, uh Uh, well don't waste time Give me a sign Tell me how you wanna roll, uh, mm I want somebody to speed it up for me Then take it down slow There's enough room for both Well, I can handle that You just gotta show me where it's at Are you ready to go? (Are you ready to go?) (freaky, freaky, freaky, freaky, freaky come on) If you want it You already got it If you thought it It better be what you want, uh (freaky, freaky) If you feel it It must be real just Say the word and I'm a give you what you want, uh Time is waiting We only got four minutes To save the world No hesitating Grab a boy Grab a girl Time is waiting We only got four minutes To save the world No hesitating We only got four minutes, huh Four minutes So keep it up, keep it up Don't be a pri- (hey), Madonna, uh You gotta get 'em a, hop Tick tock tick tock tick tock That's right, keep it up, keep it up Don't be a pri- (hey) Madonna, uh You gotta get em' a, hop Tick tock tick tock tick tock (freaky, freaky) Sometimes I think what I need Is a you intervention, yeah And you know I can (ah c'mon) Tell that you like it And that it's good, by the way That you move, ooh, hey The road to hell is paved With good intentions, yeah But if I die tonight At least I can say I did What I wanted to do, uh Tell me, how 'bout you? If you want it You already got it If you thought it It better be what you want (uh, c'mon) If you feel it It must be real just Say the word and I'ma give you what you want, uh Time is waiting We only got four minutes To save the world No hesitating Grab a boy Grab a girl Time is waiting We only got four minutes To save the world No hesitating We only got four minutes, huh Four minutes So keep it up, keep it up Don't be a pri-hey, Madonna, uh You gotta get 'em a, hop Tick tock tick tock tick tock That's right, keep it up, keep it up Don't be a pri-hey, Madonna, uh You gotta get 'em a, hop Tick tock tick tock tick tock Breakdown, yeah (Tick tock tick tock tick tock) Yeah, uh huh (Tick tock tick tock tick tock) I only got four minutes, to save the world" + song_duration = 4:03 + song_image_url = https://upload.wikimedia.org/wikipedia/en/f/f5/Madonna_4_Minutes_Coverart.png + song_genre = Pop + song_style = "" ---> bài hát này không có style, em phải để ý sẽ có bài hát có style + written by = Floyd Nathaniel Hills, Justin Timberlake, Madonna Ciccone, Timothy Mosley + artist_id = 64565 + album_name = The Complete Studio Albums (1983-2008) + album_id = 2406888 + album_year = 2012 + album_url = https://www.lyrics.com/album/2406888/The-Complete-Studio-Albums-(1983-2008) 3. Lưu ý: - các field thông tin anh liệt kê theo chiều dọc để em dễ đọc, nhưng anh cần file format là 1 file CSV, mỗi field cách nhau bởi tab để anh import vào mySQL - các field lưu không có ký tự xuống dòng (\n) nhưng riêng field song_lyrics em phải lưu đủ dấu xuống dòng - các field artist_bio, song_intro, song_lyrics có thể sẽ bị chèn html --> em phải remove hết HTML đi (giống như PHP có hàm strip_tags, chỉ cần gọi là remove hết. Nếu em code = C# thì cũng tương tự) - khi em lưu thành file CSV, nếu file lớn quá thì em có thể tách ra nhiều file như: artist_001.csv, artist_002.csv, ... songs_001.csv, songs_002.csv, ... cho nhẹ --- Double Post Merged, Oct 27, 2021, Original Post Date: Oct 27, 2021 --- Em OK thì liên hệ anh qua telegram: @andymmo để anh gửi file link artist
Nếu ko có gì bí mật có thể chia sẽ public cho ae dev tham khảo luôn dc ko thím? Mình nghĩ mấy cái nầy ae dev ai củng cần hết á :v
mình mấy năm nay mỗi tháng chỉ kiếm dc một vài đồng từ web, giờ phải chạy grab để kiếm thêm. bác có tút 50k thì ib mình xin riêng nhé