AI and the Fragility of Weak Academic Models

For a century, universities justified their authority not merely through what happened in classrooms but through what they verified at the end: examinations, essays, portfolios, dissertations, and capstone projects designed to certify that specific knowledge and capabilities had been acquired. That certification architecture is the social foundation of the degree's value. When it collapses, the degree collapses with it.

Where generative AI has struck is not the lecture — it is the assessment. That displacement is the most consequential development to reckon with in AI's relationship to higher education, and the one most institutions have not yet been willing to name clearly.

The Scale of What Has Already Happened

The data on student AI use is no longer ambiguous. The third annual HEPI/Kortext Student Generative AI Survey, conducted by Savanta in December 2025 with 1,054 full-time UK undergraduates, found that 95% of students now use AI in some form and 94% use generative AI to support assessed work.^[1] The proportion directly including AI-generated text in submitted work has risen to 12%, up from 8% the year prior and 3% in 2024.^[1] The Stanford HAI AI Index 2026 corroborates the direction of travel: AI usage in higher education reaches approximately 90% in the United States and 95% in the United Kingdom, with 39.8% of students using AI to create content and 30.2% using it for analysis — tasks that occupy the core of what most traditional assessments are designed to measure.^[2]

95% of UK undergraduates now use AI in some form; 94% use it to support assessed work. AI-generated text appears in 12% of submissions — up from 3% in 2024.

Stephenson & Armstrong (2026), HEPI Report 199 [1]

Nearly two-thirds of students (65%) report that assessment has changed in response to AI.^[1] The operative word is changed, not improved. Most institutional changes have been defensive and reactive: oral components added, handwritten elements required, AI-detection software deployed despite its documented limitations. What most institutions have avoided is the harder question — whether assessment architectures built for a world in which information retrieval and text synthesis were difficult remain valid measures of learning in a world where they are not.

Research published in the British Journal of Educational Technology makes the structural character of this problem explicit: generative AI's effect on academic integrity is not primarily a matter of cheating behavior but of assessment validity — whether the tasks being evaluated still measure what institutions claim they measure.^[3] The distinction matters for policy design. A cheating problem calls for better detection and deterrence. An assessment validity problem calls for fundamental redesign of what is being measured.

The Credential's Evidentiary Foundation

A university credential is a certification claim. It asserts, on behalf of an institution with reputational standing, that this person has demonstrated specific competencies through a process the institution designed and administered. The social value of the degree — its labor market signal, its professional licensing function, its status currency — rests entirely on the credibility of that claim. Withdraw the evidentiary foundation, and what remains is a credential without substance: a signal whose meaning has decoupled from the performance it was supposed to indicate.

That decoupling is already underway. When a student submits AI-generated text that an instructor cannot distinguish from the student's own work, and that text receives a grade, the grade certifies the AI's performance, not the student's. The transcript records a mark; the degree records a credential. Neither records what the student can do. Employers are beginning to notice: graduate entry-level skill deficits — long a background concern in hiring — have sharpened into a widely reported pattern in employer surveys conducted since generative AI became widely accessible.

The degree's social value rests entirely on the credibility of its certification claim. When assessment no longer reliably measures what it claims to measure, the degree retains its form while losing its substance — and, in time, its function.

Why Weak Academic Models Are Most Vulnerable

The assessment vulnerability created by generative AI is not uniform — it is stratified, and that stratification maps almost precisely onto the existing quality hierarchy of higher education.

Institutions with strong academic models are not immune, but they have structural buffers. Small class sizes support oral examination and supervised assessment. Research-active faculty design tasks embedded in current scholarly debates that AI tools cannot easily navigate. Strong advising cultures make it harder to submit work that does not reflect sustained engagement. And disciplinary cultures in medicine, law, engineering, and the performing arts have long maintained high-stakes performance assessment that AI cannot replicate: the clinical examination, the moot court, the design review, the concert performance.

Institutions with weak academic models — characterized by large lecture courses, high contingent faculty ratios, generic essay prompts, and assessment calendars calibrated to administrative convenience rather than learning design — have few of these buffers. Their assessment architecture consists precisely of the tasks AI performs most competently: information synthesis, argument construction, report generation, and the production of plausible analytical prose. A 2025 systematic review in AI & Ethics finds that assessments depending on tasks AI can perform with high competence are already substantially compromised, while those requiring demonstrable physical performance, real-time interpersonal interaction, or original empirical work remain significantly more robust.^[4]

Only 10% of schools and universities globally have established AI use guidelines. Only 29% of students feel their institution actively encourages AI use — while 40% disagree.

UNESCO (2026) [5] / Stephenson & Armstrong (2026), HEPI Report 199 [1]

UNESCO reports that only 10% of schools and universities globally have established guidelines for AI use.^[5] The HEPI 2026 survey found that only 29% of students feel their institution encourages AI use, while 40% disagree^[1] — most institutions have neither prohibited AI clearly nor integrated it thoughtfully, but occupy an incoherent middle ground that satisfies no educational objective and provides no governance clarity. That paralysis in the face of a known and measurable challenge is itself a governance failure.

The Identity Crisis of the Professoriate

Behind the assessment crisis lies a deeper institutional question that universities have been more reluctant to address: what does it mean to be a scholar — and a teacher — when the informational monopoly that partly justified the professorial role has been dissolved?

For most of the university's history, the professor was the primary conduit through which students accessed organized, expert knowledge in a field. Proximity to a scholar — in seminars, laboratories, and office hours — was educationally irreplaceable. The web disrupted the first part of this: information became widely accessible without scholarly mediation. AI is disrupting the second: synthesis, analysis, explanation, and first-draft production no longer require expert human labor.

What remains — irreducibly human and not replicable by machine — is the capacity to exercise judgment in the face of genuine uncertainty; to accompany a developing mind through the experience of being wrong; to model intellectual seriousness and disciplinary ethics through sustained personal engagement; and to perform the creative and interpretive work at the frontier of knowledge that requires not just training data but curiosity, personal stake, and the embodied experience of living in a particular time and place. These are the capacities that make the academic relationship educationally valuable — and the ones most systematically underinvested across institutional contexts.

The faculty capable of delivering them — research-active, institutionally committed, available to students across the extended arc of their formation — has been progressively replaced by contingent academic labor that has neither the time nor the institutional relationship to provide what AI cannot. The result is an institution that has lost both competitive advantages simultaneously: the informational function has been superseded by technology, and the mentorship function was already being hollowed out before AI arrived. This is the context in which the assessment validity crisis lands. The institution least able to redesign assessment around supervised performance and mentored judgment is precisely the one that has most hollowed out the faculty capacity to deliver those things.

Assessment Redesign Is Not Optional

The predominant institutional response to AI in higher education has been defensive: detection tools, honor code updates, policy amendments. These responses are inadequate not because integrity is unimportant but because they address the symptom — unauthorized AI use — rather than the underlying condition: assessments that have lost evidentiary validity.

The research on detection is unambiguous about its limitations. A 2025 study by Leong and Zhang found that detection tools correctly identified AI-generated text 74% of the time under controlled conditions — a figure that fell to 42% when students made minor modifications to the output.^[6] The Higher Education Authority of Ireland's 2025 National Policy Framework on Generative AI in Teaching and Learning concluded that AI-resilient assessment design is both more effective and more defensible than detection-based enforcement: detection chases a moving target, while redesign addresses the underlying vulnerability.^[7] A 2026 systematic critical review in Frontiers in Education surveying 54 empirical studies confirms that the academic literature has shifted clearly from a detection paradigm to a redesign paradigm — while acknowledging that the evidence base for specific redesign strategies remains underdeveloped and requires careful evaluation rather than confident prescription.^[8]

Assessment redesign means something specific and demanding. It means identifying, for each course and program, which learning outcomes require demonstration through means AI cannot substitute for: supervised performance, oral defense, original empirical work, client interaction, clinical demonstration, creative production with a verifiable process. It means building cumulative assessment sequences so that a student who outsources early work cannot plausibly produce the later work that depends on foundations those early assignments were supposed to build. And it means accepting — in the course design process, not just in policy documents — that certain traditional formats have lost their validity as measures of student learning.

This is demanding work: it requires protected faculty time, curriculum review, and genuine governance support. It is also the most substantive response to the actual problem — not whether students use AI, but whether the institution can still certify what it claims to certify.

AI does not threaten the university because it replaces professors. It threatens universities that cannot answer the question: what, precisely, are we still certifying — and how do we know?

The University's Durable Comparative Advantage

AI has clarified, by eliminating alternatives, what the university's genuine comparative advantage is: the supervised context in which judgment is exercised under accountability, where mentorship happens in real time, where failure is pedagogically managed by someone who knows the student and cares about their development, and where the performance being evaluated is demonstrably the student's own. No AI system can replicate that context, and no online platform, content library, or credentialing startup can provide it at scale with equivalent quality.

An institution that designs its curriculum around supervised performance, authentic problem engagement, and the cumulative demonstration of judgment has a defensible answer to AI's challenge. One that responds only with detection tools and honor code updates is defending a model whose foundations have already shifted beneath it — and doing so without the faculty capacity or the assessment infrastructure to mount an alternative.

The students who will thrive in an AI-saturated labor market are not those who used AI most fluently in their undergraduate years. They are those who developed, under genuine institutional accountability, the judgment, disciplinary seriousness, and interpersonal competence that AI augments but cannot produce. The institutions that form those students — that can certify those capabilities with evidentiary confidence — will remain indispensable. Those that cannot will face a legitimacy question that no communications strategy can resolve.

Implications for Leaders

For University Presidents and Rectors

The AI integrity crisis is an institutional design problem, not a student behavior problem. Reframing it as such is the necessary first step — it shifts accountability to where it belongs and moves the institutional response from policing to redesign.
Commission an honest audit of the institution's assessment portfolio. For each major program, the question is which assessments retain evidentiary validity in an AI-accessible environment and which have lost it. The audit will be uncomfortable. It is still necessary.
Faculty development for assessment redesign requires protected time and resources — it cannot be added to existing workloads without removing something else. Prioritizing it signals that the institution takes quality seriously rather than managing its appearance.

For Governing Boards

Request a report on the institution's AI assessment strategy — not its AI policy, but its assessment strategy. The difference is between a document specifying what students may do and a design framework ensuring assessments remain valid measures of learning regardless of what students do.
Contingent faculty ratios are an indicator of assessment quality risk. Faculty contracted course by course cannot invest in the iterative curriculum revision that AI-resilient assessment requires. Ask what proportion of instruction is delivered by faculty with genuine institutional continuity.
Employer feedback on graduate skill readiness is an early signal of credential validity problems. Ask whether the institution collects this data systematically — and whether any shift has been observed since generative AI became widely accessible.

For Policymakers

Accreditation standards that do not address AI-era assessment validity are already outdated. The shift from process-focused compliance standards to outcome-focused performance standards has become urgent. AI has set the timeline.
The policy investment with the most durable return is in assessment redesign capacity: faculty development funding, curriculum review infrastructure, and research into what robust assessment looks like across different disciplines and institutional types. The detection-enforcement approach is trading the wrong currency.

Questions Boards Should Be Asking

Has the institution conducted an assessment validity audit in the past twelve months — a review of which assessments still measure what they claim to measure in an AI-accessible environment?
What percentage of the institution's program assessments include at least one component requiring demonstrable individual performance that AI cannot substitute for: oral defense, supervised examination, clinical demonstration, or original empirical work?
What is the institution's contingent-to-full-time faculty ratio, and how has it changed over the past decade? Does the institution have a stated position on where that ratio should be?
What does employer feedback indicate about the preparedness of recent graduates? Has any shift been observed in the cohorts that were undergraduates when generative AI became widely accessible?
Does the institution's AI guidance distinguish between authorized AI use in learning and unauthorized use in assessment — and does the assessment design make that distinction operationally meaningful?

Sources and References

[1] Stephenson, R., & Armstrong, C. (2026, March). Student generative AI survey 2026 (HEPI Report 199). Higher Education Policy Institute & Kortext. → Link

[2] Stanford Human-Centered Artificial Intelligence. (2026). AI Index Report 2026. Stanford University. → Link

[3] Kofinas, A. K., Tsay, C. H., & Pike, D. (2025). The impact of generative AI on academic integrity of authentic assessments within a higher education context. British Journal of Educational Technology, 56(6), 2522–2549. → doi

[4] Kasneci, E., et al. (2025). Redefining student assessment in AI-infused learning environments: A systematic review of challenges and strategies for academic integrity. AI & Ethics. → doi

[5] UNESCO. (2026). Guidance for generative AI in education and research. United Nations Educational, Scientific and Cultural Organization. → Link

[6] Leong, W. Y., & Zhang, J. B. (2025). AI on academic integrity and plagiarism detection. ASM Science Journal, 20(1), Article 1918. → doi

[7] Higher Education Authority. (2025, December). HEA National Policy Framework on Generative AI in Teaching and Learning. Government of Ireland. → Link

[8] Bannister, P., et al. (2026). A systematic critical review of generative AI's impact on authorship, pedagogy, and integrity (2023–2025). Frontiers in Education. → doi

Durante un siglo, las universidades han justificado su autoridad no solo por lo que ocurre en las aulas, sino por lo que verifican al final: exámenes, ensayos, portafolios, tesis y proyectos de graduación diseñados para certificar los conocimientos y capacidades adquiridos. Esa arquitectura de certificación es el fundamento social del valor de la titulación. Si colapsa, la titulación lo hace también.

Donde la IA generativa ha irrumpido con mayor impacto no es en la clase magistral, sino en la evaluación. Este desplazamiento constituye el cambio más decisivo en la relación entre la inteligencia artificial y la educación superior — y el que la mayoría de las instituciones aún no está dispuesta a nombrar con claridad.

La escala de lo que ya ha ocurrido

Los datos sobre el uso estudiantil de la IA han dejado de ser ambiguos. La tercera edición anual de la Encuesta sobre IA Generativa entre Estudiantes de HEPI y Kortext, realizada en el Reino Unido por Savanta en diciembre de 2025 con 1.054 estudiantes universitarios de tiempo completo, encontró que el 95% usa la IA de alguna manera y que el 94% usa la IA generativa para ayudarse en trabajos evaluados.^[1] La proporción que incluye directamente texto generado por IA en los trabajos entregados ha ascendido al 12%, frente al 8% el año anterior y el 3% en 2024.^[1] El Informe sobre IA 2026 de Stanford HAI corrobora la dirección del cambio: el uso de la IA en la educación superior alcanza aproximadamente el 90% en los Estados Unidos y el 95% en el Reino Unido, con un 39,8% de los estudiantes utilizando la IA para crear contenido y un 30,2% para el análisis — tareas que ocupan el núcleo de lo que la mayoría de las evaluaciones tradicionales pretenden medir.^[2]

El 95% de los universitarios del RU usa la IA en alguna forma; el 94% la usa para trabajos evaluados. Texto generado por IA aparece en el 12% de entregas — frente al 3% en 2024.

Stephenson y Armstrong (2026), HEPI Informe 199 [1]

Casi dos tercios de los estudiantes (65%) reportan que la evaluación ha cambiado como respuesta a la IA^[1] — pero la palabra operativa es cambiado, no mejorado. La mayoría de los cambios institucionales han sido defensivos y reactivos: componentes orales añadidos, elementos manuscritos exigidos, software de detección desplegado a pesar de sus limitaciones documentadas. Lo que la mayoría de las instituciones elude preguntarse es si los esquemas de evaluación diseñados para un mundo donde la recuperación de información y la síntesis de textos eran tareas costosas siguen siendo válidos en un mundo donde ya no lo son.

La investigación publicada en el British Journal of Educational Technology hace explícito el carácter estructural del problema: el efecto de la IA generativa sobre la integridad académica no es esencialmente una cuestión de comportamiento deshonesto, sino de validez de la evaluación — es decir, si las tareas que se evalúan siguen midiendo lo que las instituciones afirman que miden.^[3] La distinción tiene consecuencias de fondo para el diseño de políticas. Un problema de deshonestidad académica exige mejor detección y disuasión. Un problema de validez de la evaluación exige un rediseño de aquello que se evalúa.

El fundamento de la credencial como evidencia

Una credencial universitaria es una afirmación de certificación. Sostiene, en nombre de una institución con autoridad reputacional, que esta persona ha demostrado competencias específicas a través de un proceso que la institución diseñó y administró. El valor social del título — su señal en el mercado laboral, su función de habilitación profesional, su divisa de estatus — descansa enteramente en la credibilidad de esa afirmación. Cuando se retira el fundamento evidencial de esa afirmación, lo que queda es una credencial sin sustancia: una señal cuyo significado se ha desacoplado del desempeño que se suponía debía indicar.

Ese desacoplamiento está ya en marcha. Cuando un estudiante entrega texto generado por IA que un instructor no puede distinguir del propio, y ese texto recibe una calificación, la calificación certifica el desempeño de la IA, no el del estudiante. La transcripción registra una nota; el título registra una credencial. Ninguno de los dos registra lo que el estudiante puede hacer. Los empleadores están comenzando a advertirlo: los déficits de competencia en los egresados recientes — largo tiempo una preocupación de fondo en la contratación — se han agudizado en las encuestas a empleadores realizadas desde que la IA generativa se volvió ampliamente accesible.

El valor social del título descansa enteramente en la credibilidad de su afirmación de certificación. Cuando la evaluación deja de medir de manera confiable lo que afirma medir, el título conserva su forma mientras pierde su sustancia — y, con el tiempo, su función.

Por qué los modelos académicos débiles son los más vulnerables

La vulnerabilidad en la evaluación creada por la IA generativa no es uniforme — está estratificada, y esa estratificación se corresponde con precisión con la jerarquía de calidad existente en la educación superior.

Las instituciones con modelos académicos sólidos no son inmunes, pero cuentan con amortiguadores estructurales. Los grupos pequeños facilitan la evaluación oral y la supervisión directa. El profesorado con actividad investigadora diseña tareas ancladas en debates académicos actuales que las herramientas de IA no pueden navegar con facilidad. Las culturas disciplinares de la medicina, el derecho, la ingeniería y las artes escénicas han mantenido evaluaciones de desempeño que la IA no puede replicar: el examen clínico, la simulación judicial, la revisión de diseño, la actuación en público.

Las instituciones con modelos académicos débiles — caracterizadas por grandes cursos magistrales, alta proporción de docentes contratados por hora, consignas de ensayo genéricas y calendarios de evaluación calibrados a la conveniencia administrativa — cuentan con pocos de estos amortiguadores. Su arquitectura de evaluación consiste precisamente en las tareas que la IA ejecuta con mayor competencia: síntesis de información, construcción de argumentos, generación de informes y producción de prosa analítica plausible. Una revisión sistemática de 2025 publicada en AI & Ethics encuentra que las evaluaciones que dependen de tareas con alta competencia para la IA ya están sustancialmente comprometidas, mientras que las que exigen desempeño físico demostrable, interacción interpersonal en tiempo real o trabajo empírico original siguen siendo significativamente más robustas.^[4]

Solo el 10% de las instituciones educativas a nivel global ha establecido directrices para el uso de la IA. Solo el 29% de los estudiantes del RU siente que su institución alienta activamente el uso de la IA.

UNESCO (2026) [5] / Stephenson y Armstrong (2026), HEPI Informe 199 [1]

La UNESCO reporta que solo el 10% de las escuelas y universidades a nivel global ha establecido directrices para el uso de la IA.^[5] La encuesta HEPI 2026 encontró que solo el 29% de los estudiantes considera que su institución los alienta a usar IA, mientras que el 40% discrepa^[1] — la mayoría de las instituciones no ha prohibido la IA con claridad ni la ha integrado de manera reflexiva, sino que ocupa una posición intermedia que no satisface ningún objetivo educativo ni proporciona claridad de gobernanza. Esta parálisis ante un desafío conocido y mensurable es, en sí misma, un fracaso de gobernanza.

La crisis de identidad del cuerpo académico

Detrás de la crisis de evaluación hay una pregunta institucional más profunda que las universidades han sido más reacias a abordar: ¿qué significa ser académico — y docente — cuando el monopolio informacional que justificaba en parte el rol profesoral ha sido disuelto?

Durante la mayor parte de la historia de la universidad, el profesor era el conducto principal a través del cual los estudiantes accedían al conocimiento organizado y experto en un campo. La proximidad a un académico — en seminarios, laboratorios y horas de tutoría — era educativamente irreemplazable. La web perturbó la primera parte de esto: la información se volvió ampliamente accesible sin mediación académica. La IA está perturbando la segunda: la síntesis, el análisis, la explicación y la producción de borradores iniciales ya no requieren trabajo humano experto.

Lo que permanece — irreductiblemente humano y no replicable por máquinas — es la capacidad de ejercer el juicio frente a la incertidumbre genuina; de acompañar a una mente en desarrollo a través de la experiencia de equivocarse; de modelar la seriedad intelectual y la ética disciplinar mediante el compromiso personal sostenido; y de realizar el trabajo creativo e interpretivo en la frontera del conocimiento que exige no solo datos de entrenamiento, sino curiosidad, implicación personal y la experiencia encarnada de vivir en un tiempo y lugar particulares. Son estas capacidades las que hacen valiosa la relación académica desde el punto de vista educativo — y las que, en la mayoría de los contextos institucionales, están más sistemáticamente subinvertidas.

El cuerpo académico capaz de proporcionarlas — con actividad investigadora, compromiso institucional y disponibilidad para los estudiantes a lo largo del arco extendido de su formación — ha sido progresivamente reemplazado por trabajo académico precarizado que no tiene el tiempo ni la relación institucional necesaria para ofrecer lo que la IA no puede. El resultado es una institución que ha perdido simultáneamente ambas ventajas competitivas: la función informacional ha sido superada por la tecnología, y la función de mentoría ya estaba siendo vaciada antes de que llegara la IA. Es en este contexto donde aterriza la crisis de validez de la evaluación. La institución menos capaz de rediseñar la evaluación en torno al desempeño supervisado y al juicio tutelado es precisamente la que más ha vaciado la capacidad docente necesaria para proveerlos.

El rediseño de la evaluación no es opcional

La respuesta institucional predominante a la IA en la educación superior ha sido defensiva: herramientas de detección, actualizaciones de los códigos de honor, enmiendas a las políticas. Estas respuestas son insuficientes no porque la integridad sea irrelevante, sino porque abordan el síntoma — el uso no autorizado de la IA — en lugar de la condición subyacente: evaluaciones que han perdido su validez evidencial.

La investigación sobre las limitaciones de la detección es clara. Un estudio de 2025 realizado por Leong y Zhang encontró que las herramientas de detección identificaban correctamente el texto generado por IA el 74% de las veces en condiciones controladas — cifra que caía al 42% cuando los estudiantes realizaban modificaciones menores.^[6] El Marco Nacional de Política sobre IA Generativa en la Enseñanza y el Aprendizaje de la Autoridad de Educación Superior de Irlanda, publicado en diciembre de 2025, concluyó que el diseño de evaluaciones resilientes a la IA es más eficaz y más defendible que la aplicación basada en la detección: la detección persigue un objetivo en movimiento mientras que el rediseño aborda la vulnerabilidad subyacente.^[7] Una revisión sistemática crítica de 2026 publicada en Frontiers in Education que examina 54 estudios empíricos constata que la literatura académica ha transitado claramente de un paradigma de detección a un paradigma de rediseño — reconociendo al mismo tiempo que la base de evidencia para estrategias específicas de rediseño sigue siendo incipiente y requiere evaluación cuidadosa antes que prescripción confiada.^[8]

El rediseño de la evaluación significa algo específico y exigente. Significa identificar, para cada curso y programa, qué resultados de aprendizaje requieren demostración a través de medios que la IA no puede sustituir: desempeño supervisado, defensa oral, trabajo empírico original, interacción con situaciones reales, demostración clínica, producción creativa con proceso verificable. Significa construir secuencias de evaluación acumulativas, de modo que el estudiante que externaliza los trabajos iniciales no pueda producir los posteriores que dependen de los fundamentos que aquellos debían construir. Y significa aceptar — en el proceso de diseño curricular, no solo en los documentos de política — que ciertos formatos tradicionales han perdido su validez como medidas del aprendizaje estudiantil.

Se trata de un trabajo exigente: requiere tiempo protegido para el profesorado, revisión curricular y apoyo genuino de la gobernanza. Es también la respuesta más sustantiva al problema real — no si los estudiantes usan la IA, sino si la institución puede seguir certificando lo que afirma certificar.

La IA no amenaza a la universidad porque reemplace a los profesores. Amenaza a las universidades que no pueden responder la pregunta: ¿qué, con precisión, seguimos certificando — y cómo lo sabemos?

La ventaja comparativa duradera de la universidad

La IA ha clarificado, al eliminar alternativas, en qué consiste la ventaja comparativa genuina de la universidad: el contexto supervisado en el que el juicio se ejerce bajo rendición de cuentas, donde la mentoría ocurre en tiempo real, donde el fracaso es gestionado pedagógicamente por alguien que conoce al estudiante y se preocupa por su desarrollo, y donde el desempeño que se evalúa es demostrablemente propio del estudiante. Ningún sistema de IA puede replicar ese contexto, y ninguna plataforma en línea, biblioteca de contenidos o startup de credencialización puede proveerlo a escala con calidad equivalente.

Una institución que diseña su currículo en torno al desempeño supervisado, al compromiso con problemas auténticos y a la demostración acumulativa del juicio tiene una respuesta defendible al desafío de la IA. La que responde únicamente con herramientas de detección y actualizaciones de sus códigos de honor está defendiendo un modelo cuyos fundamentos ya se han desplazado bajo sus pies — y lo hace sin la capacidad docente ni la infraestructura de evaluación necesarias para ofrecer una alternativa.

Los estudiantes que prosperarán en un mercado laboral saturado de IA no son los que usaron la IA con mayor fluidez durante sus años universitarios. Son los que desarrollaron, bajo rendición de cuentas institucional genuina, el juicio, la seriedad disciplinar y la competencia interpersonal que la IA puede aumentar pero no puede producir. Las instituciones que forman a esos estudiantes — que pueden certificar esas capacidades con confianza evidencial — seguirán siendo indispensables. Las que no puedan hacerlo enfrentarán una pregunta de legitimidad que ninguna estrategia de comunicación podrá resolver.

Implicaciones para los líderes

Para presidentes y rectores

La crisis de integridad relacionada con la IA es un problema de diseño institucional, no de comportamiento estudiantil. Reencuadrarlo como tal es el primer paso necesario: traslada el foco institucional desde la vigilancia hacia el rediseño, y ubica la responsabilidad donde corresponde.
Encargue una auditoría honesta del portafolio de evaluaciones de la institución. Para cada programa importante, la pregunta es cuáles evaluaciones conservan su validez evidencial en un entorno accesible para la IA y cuáles la han perdido. La auditoría será incómoda. Es necesaria.
El desarrollo del profesorado para el rediseño de las evaluaciones requiere tiempo protegido y recursos — no puede añadirse a las cargas de trabajo existentes sin retirar algo más. Priorizarlo señala que la institución toma en serio la calidad y no solo su apariencia.

Para los consejos de gobierno

Solicite un informe sobre la estrategia de evaluación de la institución frente a la IA — no la política sobre IA, sino la estrategia de evaluación. La diferencia es entre un documento que especifica lo que los estudiantes pueden hacer y un marco de diseño que garantiza que las evaluaciones sigan siendo medidas válidas del aprendizaje.
Las proporciones de docentes contratados por hora son un indicador de riesgo para la calidad de la evaluación. El profesorado contratado curso por curso no puede invertir en la revisión curricular iterativa que una evaluación resiliente a la IA requiere. Pregúntese qué proporción de la docencia es impartida por profesorado con continuidad institucional real.
La retroalimentación de los empleadores sobre la preparación de los egresados es una señal temprana de problemas de validez credencial. Pregúntese si la institución recoge estos datos de manera sistemática y si se ha observado algún cambio desde que la IA generativa se volvió ampliamente accesible.

Para los responsables de política pública

Los estándares de acreditación que no abordan la validez de la evaluación en la era de la IA ya están desactualizados. El paso de estándares de proceso a estándares de desempeño centrados en los resultados se ha vuelto urgente. La IA ha fijado el calendario.
La inversión de política con el retorno más duradero es en la capacidad de rediseño de la evaluación: financiamiento para el desarrollo del profesorado, infraestructura de revisión curricular e investigación sobre lo que constituye una evaluación robusta en diferentes disciplinas y tipos institucionales. El enfoque de detección y aplicación opera con la moneda equivocada.

Preguntas que los consejos deberían hacer

¿Ha llevado a cabo la institución una auditoría de validez de las evaluaciones en los últimos doce meses — una revisión de cuáles evaluaciones siguen midiendo lo que afirman medir en un entorno accesible para la IA?
¿Qué porcentaje de las evaluaciones de los programas incluye al menos un componente que exige un desempeño individual demostrable que la IA no puede sustituir: defensa oral, examen supervisado, demostración clínica o trabajo empírico original?
¿Cuál es la proporción de docentes contratados por hora frente a docentes de tiempo completo, y cómo ha cambiado en la última década? ¿Tiene la institución una posición declarada sobre cuál debería ser esa proporción?
¿Qué indica la retroalimentación de los empleadores sobre la preparación de los egresados recientes? ¿Se ha observado algún cambio en las cohortes que fueron estudiantes cuando la IA generativa se volvió ampliamente accesible?
¿Distingue la orientación institucional sobre IA entre el uso autorizado en el aprendizaje y el uso no autorizado en la evaluación — y el diseño de las evaluaciones hace que esa distinción sea operativamente significativa?

Fuentes y referencias

[1] Stephenson, R., & Armstrong, C. (2026, marzo). Student generative AI survey 2026 (HEPI Informe 199). Higher Education Policy Institute & Kortext. → Enlace

[2] Stanford Human-Centered Artificial Intelligence. (2026). AI Index Report 2026. Universidad de Stanford. → Enlace

[4] Kasneci, E., et al. (2025). Redefining student assessment in AI-infused learning environments: A systematic review of challenges and strategies for academic integrity. AI & Ethics. → doi

[5] UNESCO. (2026). Guidance for generative AI in education and research. Organización de las Naciones Unidas para la Educación, la Ciencia y la Cultura. → Enlace

[6] Leong, W. Y., & Zhang, J. B. (2025). AI on academic integrity and plagiarism detection. ASM Science Journal, 20(1), artículo 1918. → doi

[7] Higher Education Authority. (2025, diciembre). HEA National Policy Framework on Generative AI in Teaching and Learning. Gobierno de Irlanda. → Enlace

[8] Bannister, P., et al. (2026). A systematic critical review of generative AI's impact on authorship, pedagogy, and integrity (2023–2025). Frontiers in Education. → doi

Higher Education at the Crossroads · 11-Essay Series

La educación superior en encrucijada · Serie de 11 ensayos

← Previous

← Anterior

Essay 2 — The Coming Legitimacy Crisis of the University

Ensayo 2 — La crisis de legitimidad a la que se aproxima la universidad

Essay 4 — The Geography of Global Higher Education

Ensayo 4 — La geografía de la educación superior global

Rethinking your institution's AI strategy and assessment architecture?

¿Repensando la estrategia de IA y arquitectura de evaluación de su institución?

Get in touch → Contáctenos →