[Nhờ hỗ trợ có gửi phí] cần xử lý với khối lượng dữ liệu lớn

[Nhờ hỗ trợ có gửi phí] Hi mọi người, mình (không phải làm về IT) có 1 công việc cần xử lý với khối lượng dữ liệu lớn (hơn 300,000 dòng tiếng Việt trong excel) mà mình nghĩ có thể dùng automake xử lý, nếu không thì sẽ rất là mất thời gian. Mình mô tả như dưới đây kèm theo cách mình đang làm, nhờ mọi người xem có thể xử lý giúp và mình có gửi phí hỗ trợ nhé:

Hiện trạng và nhu cầu:

1 file excel có hơn 300,000 dòng (có thể tách nhỏ ra hơn hoặc chuyển thành Google Sheet nếu cần) có cột A là cột Nội dung chính. Từ cột này, mình cần tạo thêm nội dung cho 2 cột mới là: Tiêu đề SEO và thẻ Meta sao cho chuẩn YOAST SEO. Ví dụ:

Nội dung Cột A: Nằm trong khu phố yên tĩnh, căn nhà hai tầng hiện đại với mặt tiền rộng 6m, sân vườn nhỏ phía trước, không gian mở với phòng khách rộng rãi, cửa kính lớn đón ánh sáng tự nhiên, 3 phòng ngủ, 2 phòng tắm và khu bếp tiện nghi nối liền phòng ăn, mang đến cảm giác ấm cúng và thoải mái cho cả gia đình.

- Tiêu đề SEO: Nhà Hai Tầng Hiện Đại: Mặt Tiền 6m, 3 Phòng Ngủ, Sân Vườn

- Thẻ Meta: Căn nhà hai tầng rộng rãi, thiết kế mở, có sân vườn nhỏ, phòng khách lớn, 3 phòng ngủ, 2 phòng tắm và bếp tiện nghi, mang lại không gian sống thoải mái.

Khó khăn gặp phải:

  1. Nội dung Tiêu đề SEO và Thẻ Meta sẽ cần phải có nghĩa, hay nói cách khác là được tóm tắt từ nội dung của cột A. Ngoài ra, sẽ cần giới hạn số lượng ký tự để chuẩn SEO. Nếu dùng các hàm cắt ký tự thì sẽ không đúng yêu cầu đặt ra.

  2. Mình có dùng thử qua các công cụ ChatGPt, Copilot và Gemini vì có thể tóm tắt được nội dung. Điểm chung của 3 tools này là giới hạn số lượng dòng xử lý cho mỗi lần. So sánh kết quả thì thấy Copilot làm đúng theo prompt nhất. Hiện mình đang làm thử, mỗi lần chỉ có thể copy 25 dòng vào Copilot và đợi trả lời, sau đó mình copy lại vào sheet Excel.

Làm theo cách làm trên thì sẽ ngốn rất nhiều thời gian làm thủ công.

Do đó, mình đang nghĩ đến ứng dụng có thể giúp automake. Ví dụ: tool sẽ auto lấy nội dung của 25 dòng/lần, đưa vào Copilot để prompt và tạo kết quả, sau đó copy kết quả vào Sheet. Sau đó tiếp tục tự động xử lý tiếp 25 dòng khác.

Trên đây là cách mình đang nghĩ đến. Nếu bạn có cách xử lý tự động thì giúp mình với nhé. Xin gửi chi phí đầy đủ.

Mình cảm ơn.

Có hai cách để tạo tool này, tuỳ nhu cầu của bạn:

Nếu offline thì dùng Python để xử lý với file, gọi AI API để viết.

Nếu cần online thì dùng n8n để tự động hoá, số lượng dữ liệu lớn thế này thì cần self-host lên VPS để chạy giúp tối ưu hoá chi phí. gọi AI API để viết.

Bạn có thể inbox nhé