Después del período de investigación inicial, los participantes realizaron sus presentaciones a pequeños grupos de sus compañeros. Los estudiantes continuaron con sus vidas académicas normales durante un mes y medio. Cuarenta y cinco días después de la fase de estudio inicial, el investigador sorprendió a los participantes con una prueba de retención. Los estudiantes que usaron métodos de estudio tradicionales obtuvieron mejores resultados. En promedio, los estudiantes tradicionales respondieron correctamente el 68,5 por ciento de las preguntas. En contraste, los estudiantes que estudiaron con el chatbot respondieron correctamente solo el 57,5 por ciento de las preguntas.
El impacto negativo del chatbot fue más pronunciado cuando los estudiantes estaban aprendiendo temas altamente técnicos. Si bien el software también afectó la memoria para temas menos técnicos, como la ética y la sociedad, la brecha entre los dos grupos no fue tan amplia. Este patrón sugiere que el esfuerzo productivo es especialmente importante al dominar material complejo o estructuralmente difícil.