[1]

Venkata Siva Prasad Bharathula, “The Role of Reward Models and Reinforcement Learning in LLM Fine-tuning”, Int. J. Sci. Res. Comput. Sci. Eng. Inf. Technol, vol. 11, no. 2, pp. 471–477, Mar. 2025, doi: 10.32628/CSEIT25112381.