Mình muốn upload các thư mục chứa dữ liệu lên server sau đó dùng phần mềm để đọc dữ liệu từ nó,cái này mình chưa làm bao giờ.Mình thấy có hai cái google cloud storages,digitalocean bạn nào làm rồi tư vấn xem mình nên chọn cái nào hoặc có cái nào dễ dùng và rẻ tư vấn mình với nhé
digitalocean $0.1/1GB/1mo bandwidth rẻ vl 0.002 thì phải, cloud storage còn rẻ hơn nhưng lại tính phí bandwidth cao )
Digi nó nói : Số lượng yêu cầu có thể được thực hiện thông qua API hiện bị giới hạn ở mức 5.000 mỗi giờ cho mỗi mã thông báo OAuth=>tức là mình crawl dữ liệu hay đọc dữ liệu ra chỉ được 5000 file mỗi giờ thôi à bạn
Nếu "dữ liệu" mà là ảnh thì có khi vài TB lận, mua cloud storage cũng tốn lắm. Anh từng nghía qua DO và Vultr rồi nhưng vẫn mắc quá. Thôi cứ server HDD to mà chứa (với trường hợp của anh thôi, còn thớt ko biết chứa gì)
Dạ em chỉ chứa file text lưu thông tin crawl thôi anh,giá thuê lưu trữ thư mục file như vậy rẻ hơn nhiều so với anh mua thêm dung lượng cho vps 100 GB thêm vô vps 10$ tháng nhưng mua storages thì do có 5$ được 250GB rẻ hơn khá nhiều,anh à.Hiện thì em vẫn để file crawl được trên máy cá nhân nhưng thế thì sau này ko được tiện lắm nên tìm hiểu dần Phần mềm đọc thì chỉ lấy đường dẫn file đọc,hoặc tải file lên server thôi chứ ko có gì nhiều
File text thì bao nhiêu lắm mà lăn tăn nhỉ. cứ chọn đại cái vps nào rẻ là được. K thì log ở local cũng được có gì được hoặc sign lên dropbox cũng được
Em tải có tí link trên youtube mà cái tệp lưu file text trên máy đã hơn 10GB rồi,máy em ổ cứng có có 300GB tải thêm thời gian nữa chắc sẽ hết vì lưu bằng file mà lại để ở máy mình nên muốn upload dữ liệu lên wordpress chỉ có thể chạy từ máy mình thôi ạ.
Nếu data là text anh sẽ ưu tiên mua server hdd. Số tiền như thế bên WSI mua dc con server riêng 500gb (tuy cấu hình hơi thấp nhưng chắc vẫn ngon hơn 1 vps)
Vậy xài HDD bên WSI như anh @money suggest. Thấy mọi người chê nhưng mà mình thấy xài vẫn ok chả vấn đề gì.
Dạ em lưu mấy thông tin cơ bản nó thôi title,keyword,descriptio,like,categories....có hơn 3tr link mà dung lượng nó lớn vậy ạ.Lúc mới crawl thấy file cho mỗi link cũng nhẹ nên em tạo một trường content nguyên gốc,một content_modify xóa hết những thứ linh tinh em tham lấy luôn cả tiêu đề mấy video cạnh nó làm thông tin liên quan.Không ngờ khi tải nhiều thì lại to vậy bác ạ
Em đang tìm hiểu HDD server như hai pro nói có cái vấn đề em vẫn chưa hiểu lắm.là cái ổ cứng hdd server đó sau khi lắp vô máy tính mình làm sao cho các vps mình câu đến.Hay em ném nó hết vào /xampp/htdocs/ rồi câu đến ạ,vì nó có chữ server lên có khi nào nó hỗ trợ câu đến cách khác dễ dàng hơn ko ? 500GB em nghĩ em còn crawl còn lâu lắm mới lấp đầy được nó.WSI là hãng nào vậy à em tìm ko thấy Cái này em mới tiếp xúc có lưu ý gì mong các pro chia sẻ em chút ạ
phát hờn với câu chả cú của cụ . Đọc 1 hồi, lặng 5' mới hiểu ra WSI là whosalesinternet bán dedi server, vào đó mua 1 con với ổ cứng HDD được rồi, cài xamp các thứ rồi upload txt của cụ lên. Nhưng mà idea mua sv để host file txt 10gb rồi lấy vps khác đọc mềnh thấy không work
cụ già rồi tìm hiểu nhầm tưởng mấy cái pro chỉ là cái ổ cứng đấu trực tiếp vô máy.Phần mềm cụ viết chưa chuẩn đăng bài lên wordpress mỗi cái 2 channel số video chưa kiểm tra kỹ mà có max thì 3000 22 trang web mà mất hai tiếng lâu quá.Lên cụ nghĩ cần thêm vps câu vào để post cho nhanh
Bạn nên dùng một database hoàn chỉnh nào đó thì hơn, mongodb, mysql ... thường họ có giải pháp nén của họ nên dung lượng cũng sẽ ít hơn so với bạn tự lưu text. Thứ 2 là bạn kiểm tra lại các thông tin của bạn có cái nào trùng nhau thì bỏ đi, ví dụ mình thấy cái youtube link thường là "https:// www youtube com/watch?v=xU3Aqr3eM54" thì đoạn này "https://www youtube com/watch?v=" luôn lặp lại bạn bỏ nó đi, chỉ lưu cái id ở cuối thôi là nhẹ đi khá nhiều rồi. Keyword, category thường trùng lặp, nếu dùng database thì để 2 cái đó vào bảng riêng rồi với mỗi clip chỉ link với cái id của keyword/category là cũng sẽ nhẹ bớt.
Tài liệu nó nhiều loại giá quá,em vẫn chưa thông.Phí banwidth nó tính như thế nào anh?.Có lưu ý gì chỉ tư vấn em thêm với