Cài Đặt Render Farm Của Houdini Là HQUEUE Và Xử Lý Những Lỗi Dễ Làm Artist Đột Quỵ

Note cho tôi, cũng như chia sẻ cho các bạn.

HQueue

Một số thứ vật vã với Houdini HQueue là phần mềm quản lý render farm đồng thời quản lý luôn simulation farm của Side FX dành cho Houdini, miễn phí. Thế mạnh của sản phẩm này so với các phần mềm manager 3rd party đó là khả năng phân phối simulation chất lưu như nước, khí, dung dịch …, và trên môi trường nhiều máy cùng tham gia làm một việc (task) để phân phối simulation.

Track simulation này có hẳn paper nghiên cứu riêng do chính SideFX nghiên cứu và phát hành (liên kết tới DOI của paper về Inside houdini’s distributed solver system) . Chức năng này giúp cho các simulation phân tán trên nhiều máy có thể biết đó là cùng một simulation task nhằm cận kề liên tiếp simulation làm đủ dữ liệu. (đây là video của Igor Zanic, chuyên gia về water FX, đồng thời cũng là người dạy tôi môn water FX ở Rebelway, ở đây RND của Igor Zanic cho thấy các fluid simulation được phân bố trên nhiều máy và tính thời gian so với chỉ một máy hay ít số máy tham gia cùng simulation hơn, link video Houdini 18 Distribute sim rnd)

Nếu chưa biết Houdini có thể làm Tech Art, VFX quằn quại tới cỡ nào, và hiện là công cụ tech art chính dùng làm visual effects trong các studio lớn nhỏ khắp thế giới sản xuất phim điện ảnh, video games, AR/XR, làm phim hoạt hình, làm phim quảng cáo, các bạn có thể xem thêm bài viết Tiếp Cận Học Và Sử Dụng Houdini FX Như Thế Nào Phù Hợp ở đây.

hình ảnh nội dung paper nghiên cứu của Side FX dành cho phần phân phối solver render qua mạng, qua render farm

Ngoài ra Hqueue cũng là anh em cột chèo với Mantra (Mantra là phần mềm render unbias tốt nhất gắn liền với , đặc biệt là dữ liệu IFD gắn liền với Mantra (tài liệu về workflow của IFD làm việc với Mantra ở đây), tuy nhiên để vật lộn đấu tranh cảm hóa được Houdini Queue là cả một quá trình nhân sinh quan, làm từ thiện nhiều, luôn nghĩ tới điều thiện, không được nóng nãy (“quyết tâm không được lóng”), vậy mà việc đang render dừng giữa chừng nữa đêm lúc đang an yên giấc nồng hay có máy trong hệ thống vào ngon ơ, có máy không vào mà mới lúc nãy vẫn vào bình thường, đây là cả nhiều hy sinh máu và nước mắt các bạn ạ.

Hồi đầu mới tiếp xúc với Hqueue đầy háo hứng vì đã dùng Backburner hơn 10 năm cho các hệ thống farm của doanh nghiệp tôi, rất nhiều note ghi lại và được in dán ra lên bảng rõ ràng đến mức bất cứ một nhân viên nào chỉ cần nhìn vào tờ giấy đó là làm được (hiện tại cái file word đó nằm trong một ổ cứng archive nào đó để hôm nào tôi lấy ra cho các bạn xem có thể ai đó cần tham khảo)

giao diện quản lý job của Hqueue thông qua trình duyệt

Tôi viết bài này vào thời điểm 2021, thế giới công nghệ đang có sự thay đổi lớn chuyển giao hệ thống và lõi phần mềm từ Python 2 sang Python 3, nên cũng lắm thứ nhọc nhằn, như hiện nay riêng phiên bản cài đặt Houdini đã có 2 phiên bản trên cùng một version, đó là bảng cài đặt Python 3 và bảng Python 2. Tôi dùng render Arnold HTOA, hiện tại cũng gây ra nhiều lỗi nếu dùng phiên bản Houdini Python 3, và nhiều phần mềm trên thế giới cũng đang như thế, có cái có lỗi sửa, có cái cần phải tự chủ với Python 2.

Về việc cài Houdini Queue, khá đơn giản, các bạn coi theo video sau đây, làm y chang là được. Đây là việc thiện duy nhất mà Hqueue dành cho chúng sanh Houdini user. (link video)




Như trong thế giới đầy kỹ thuật và đặc tính chung của những con người làm kỹ thuật quả cảm là đức tính cẩn thận, lầm lì, hạn chế nói năng linh tinh, phát biểu thừa, cũng như cũng có phần hơi khó tính, đó là cũng là cùng một lý do các bạn sẽ gặp trong thế giới Houdini khi các TD các senior không phải ai cũng dễ dàng mở lòng, cười vui vẻ hay trả lời mọi thứ. Các bạn thấy video tôi vừa gửi, khóa comment không. Tự hiểu hen.

Về việc cài đặt Hqueue, khi tôi cài xong và ứng dụng, thường xảy ra những thứ trớ trêu không hoạt động, mà mình đã chắc như in đóng cột là nó phải chạy, nên tôi đã làm phương pháp cổ điển, dò bug tuần tự các phần và ghi nhận lại lỗi, cách sửa chữa. Đây là danh sách của tôi tự sắp xếp có được, xin chia sẻ đến những người đi sau. (Chú ý. tôi dùng Windows, các OS khác tôi không biết ! mà thật ra tôi cũng không muốn biết, nhiêu đây đủ đứng hình chết rồi !)

  • Không dùng Hqueue windows services. Tắt nó luôn. Vào thư mục Hqueue để chạy file client.bat, chắc chắn hiệu quả.
  • Để hiệu quả làm việc với Hqueue, phần config mặc định của server.ini là map một thư mục share mạng vào ổ Z, các bạn làm y chang vậy là chạy, khỏi phải cài đặt hiệu chỉnh, cứ để ổ (drive) file chia sẻ dự án ở Z:\ là chạy
  • Lỗi Access Denied tức user hiện hành trong máy Windows không thể truy cập vào cái ổ mạng đã được map, sử dụng Windows Credential Manager để triệt để gán chết luôn cái truy cập là ok
  • Thỉnh thoảng, service sẽ không chạy, và không chạy, tắt hẳn luôm, dùng file client.bat thôi để chạy client
  • Gặp lỗi này khi load file lên, Error: The attempted operation failed. Tức là trong file HIP hiện đang setup phần $HIP chứ không phải $JOB, cần truy cập mọi thứ thông qua $JOB (từ file cache, file hdri, texture … kiểm tra các file asset này trong menu Render > Preflight) trong môi trường share qua mạng, khi đem dự án từ local lên network, cũng set project folder là ổ mạng $JOB, rồi vào phần Aliases & Variable để set $JOB là ổ share mạng
  • Không sử dụng $HIP khi làm việc qua các không gian chia sẻ
  • Error: “indie does not support generating disk files” > cập nhật file daily build khác (production build của bản quyền Houdini trên Side FX)
  • Thông thường tắt firewall và dùng firewall của phần mềm khác sẽ hiệu quả hơn windows defender và không phải mõi lần mỗi tương tác, hoặc cài thiết lập mọi thứ liên quan Hqueue vào inbound/outbound để firewall Windows defender nhận diện, bao gồm cài rule cho cả port
  • Host name của một máy thỉnh thoảng sẽ không có, muốn biết có hay không chạy Windows R -> command line và gõ lện nbtastat -a <IP mà đang thiết lập Hqueue server>, nếu hiện ra table IP cùng với thông tin Host Name Not Found. Giải pháp là truy cập bằng địa chỉ IP cho tất các máy thay vì dùng Host Name, điều này giúp đỡ tốn công hơn là ngồi vật lộn với IT network để làm cho một máy windows phải share Host Name thông qua network DNS.
  • Trong một số trường hợp, server khó khăn khi tìm thấy máy client, có khả năng windows bị hỏng file hệ thống, chạy lệnh này trong windows command line để giúp hồi phục chỉnh sửa file hệ thống sfc /scannow
  • Thiêt lập IP Hqueue vào file cấu hình *.ini
  • Đây là nội dung bên trong file hqserver.ini của tôi
    • hqserver.sharedNetwork.path.windows = \\<IP dẫn tới máy chia sẻ folder dự án>\<folder dự án>
    • hqserver.sharedNetwork.mount.windows = \\<IP dẫn tới máy chia sẻ folder dự án>\<folder dự án>
  • Ở trong cái ROP mà assign task lên Hqueue, dùng 3 dấu gạch thay vì 2 gạch cho phần đầu của IP dẫn tới máy chia sẻ folder dự án. “\\\IP\Folder dự án” (thật kinh khủng khi tui tìm ra điều này trằn trọc luôn !!!)
  • Alembic file sẽ không thể truy cập làm việc qua mạng. Vào file Houdini.env cài thêm dòng này
    • HOUDINI_ACCESS_METHOD = 2
  • File EXR hiện đại, có chức năng Multipart, từ H18+ đã làm được, ghi thêm dòng này vào file Houdini.env để kích hoạt cấu hình này HOUDINI_OIIO_EXR = 1
  • Output driver trên ROP là tên của file cache để chạy khi simulation phân phối

Vậy đó, lịch sử của tui đấu tranh, trằn trọc chiến đấu với thứ thông minh kỷ lục HQUEUE này làm áp lực, già đi thấy rõ sau nhiều đêm thức giấc khi biết hệ thống farm chạy không không, không hề thực hiện tác vụ, máy lạnh thì lạnh kinh hồn vì farm có chạy đâu.

Từ năm ngoái tui chuyển qua dùng AWS Thinkbox Deadline Manager thì có phần ngủ ngon hơn, chưa kể khi tôi sử dụng Blender, tôi cũng render qua mạng trên nhiều máy được, rồi dùng After Effects cũng render qua mạng được không (render ra sequence file hình chứ không phải render ra video). Ăn ngon ngủ yên hẳn.

Chưa kể AWS Deadline có chức năng sử dụng Cloud EC2 của Amazon (tốn phí), tham gia vào hệ thống render khi nào cần, nên có thể nói giàn farm có thể tăng thành một giàn khủng khiếp hoặc chỉ đơn giản 1 vài máy để test. Khi nào đó tui rành rõi và thoải mái với AWS Thinkbox Deadline tui sẽ chia sẻ với các bạn. Hiện nay cũng nhiều lỗi trời ơi lắm và chưa thật sự kiểm soát triệt để.

Một Số Tài Liệu Thêm Từ Internet

Post Author: Vu Pham