Locate anything

https://research.nvidia.com/labs/lpr/locate-anything

Otro contenido increible del fabricante NVIDIA.

Podemos decir que LocateAnything es un motor de búsqueda visual de alta velocidad.

Como usuario proporcionas un prompt de texto y al instante localiza con precisión el objeto en una imagen.

– 10x de aceleración para detección de objetos densos

– Qwen2.5-3B + Moon-ViT

– Modos Rápido/Lento/Híbrido

– entrenado con 138 M de muestras para UI, documentos, grounding genérico.


LocateAnything es un nuevo marco de vision-language grounding que propone Parallel Box Decoding (PBD) para localizar objetos y regiones en imágenes de forma mucho más rápida y precisa que los enfoques autoregresivos tradicionales.

Encuentra cualquier cosa

NVIDIA y varios partners académicos han presentado LocateAnything, un modelo unificado de grounding y detección visual que reformula la predicción de cajas como unidades atómicas completas en lugar de secuencias de tokens coordenados. Su técnica de Parallel Box Decoding (PBD) permite predecir cada bounding box en un solo paso, preservando la coherencia geométrica y eliminando el cuello de botella de la decodificación secuencial. Combinado con un modo de inferencia híbrido (rápido por defecto y autoregresivo solo cuando hay ambigüedad) y un dataset masivo de 138M consultas de lenguaje y 785M cajas, el modelo mejora el throughput hasta 2,5× frente a métodos previos, manteniendo o superando el estado del arte en benchmarks exigentes como LVIS, COCO, M6Doc o ScreenSpot‑Pro. Esto abre la puerta a aplicaciones más eficientes en detección densa, comprensión de documentos, grounding de interfaces gráficas y localización de texto u objetos en escenarios reales, especialmente en contextos donde la latencia es crítica.

vía research.nvidia

Generado con IA


ALUMNO, te puede interesar desarrollar un TFG con esta tecnología:

En este TFG desarrollarás un prototipo funcional que permite a un usuario empresarial “preguntar” a una imagen en lenguaje natural (por ejemplo, “¿Dónde están las piezas defectuosas?” o “Marca las etiquetas con fecha de caducidad”) y que el sistema responda señalando automáticamente las zonas relevantes mediante cajas o puntos sobre la imagen.

Para ello utilizarás el modelo LocateAnything‑3B de NVIDIA, un modelo visión‑lenguaje que incorpora la técnica Parallel Box Decoding, capaz de localizar múltiples objetos en paralelo de forma rápida y con buena precisión, sin necesidad de entrenar desde cero. El proyecto consistirá en:

Diseñar uno o varios casos de uso cercanos a la realidad industrial (inspección visual, almacén, etiquetado de productos, lectura de campos clave en documentos, etc.).

Montar un pequeño backend en Python que consuma el modelo (por ejemplo, a través de Hugging Face) y procese imágenes subidas por el usuario.

Desarrollar una interfaz sencilla (web o de escritorio) para que cualquier persona de la empresa pueda subir una imagen, escribir una consulta en lenguaje natural y ver en pantalla la localización automática de los elementos solicitados.

Evaluar el sistema con un conjunto de imágenes representativas, midiendo tiempos de respuesta, facilidad de uso y utilidad percibida para la empresa.

El objetivo final es que, al acabar el TFG, dispongas de un demo claro y visual que puedas presentar tanto en la universidad como ante una empresa, demostrando que sabes integrar modelos de IA generativa visión‑lenguaje en un caso de uso real y explicar su valor en términos de tiempo, coste y facilidad de implantación.


EMPRESARIO:

Estamos buscando una empresa colaboradora interesada en explorar cómo la inteligencia artificial puede ayudarle a localizar automáticamente objetos, defectos o información en imágenes reales de su negocio (línea de producción, almacén, documentación, pantallas de supervisión, etc.).

El alumno, bajo mi supervisión, utilizará el modelo LocateAnything de NVIDIA, un sistema de última generación que combina visión por computador y lenguaje natural para “entender” imágenes a partir de instrucciones en texto y marcar en pantalla exactamente lo que se le pide, con tiempos de respuesta muy reducidos gracias a su mecanismo de decodificación paralela de cajas (Parallel Box Decoding).

La idea es desarrollar durante sus prácticas y su Trabajo Fin de Grado un prototipo a medida para su caso concreto:

por ejemplo

  • localizar de forma automática determinadas piezas o componentes en fotografías de producción o mantenimiento;
  • señalar productos o etiquetas concretas en imágenes de almacén;
  • identificar y resaltar campos clave (fechas, códigos, importes) en documentos escaneados.

El proyecto se plantea como una prueba de concepto rápida y de bajo riesgo: la empresa aporta las imágenes y define las preguntas que le interesan (“¿Dónde está…?”); el alumno desarrolla el prototipo y, al finalizar, se entrega un informe con resultados, limitaciones y posibles líneas de mejora.

Para la empresa, las ventajas son claras:

  • disponer de un demo funcional aplicado a su propio entorno, sin coste de desarrollo interno;
  • evaluar de forma realista si esta tecnología puede reducir tiempos de inspección o revisión visual;
  • conocer qué recursos serían necesarios para un despliegue posterior (on‑premise o en la nube).

Si le interesa acoger a un alumno en prácticas para desarrollar este proyecto en su organización, podemos concretar un caso de uso sencillo y un calendario de trabajo, de forma que la empresa obtenga valor real mientras el estudiante realiza su TFG.

https://research.nvidia.com/labs/lpr/locate-anything

Propuesta de estructura didáctica del TFG

  • Introducción: qué es un modelo visión-lenguaje y qué significa “localizar cualquier cosa” en una imagen.
  • Marco tecnológico: descripción de LocateAnything y del enfoque Parallel Box Decoding, a un nivel comprensible pero serio.
  • Desarrollo: implementación del prototipo (arquitectura, código principal, integración básica).
  • Evaluación: pruebas con imágenes realistas de la empresa (o de dominio similar) y análisis de tiempos, precisión percibida y facilidad de uso.
  • Discusión para empresa: limitaciones, costes aproximados de despliegue (GPU/local vs. nube), oportunidades de automatización.

Neurodivergente

El perfil neurodivergente describe a una persona cuyo cerebro procesa, aprende y se comporta de manera distinta a lo que la sociedad considera estándar o “neurotípico”. No es una enfermedad, sino una variación natural del desarrollo humano que influye en la atención, la comunicación y la percepción sensorial.


Condiciones más comunes
Bajo este término se agrupan diversos funcionamientos cerebrales, entre los que destacan:
TEA (Trastorno del Espectro Autista): Diferencias en la interacción social y la comunicación, con formas particulares de percibir el entorno.
TDAH (Trastorno por Déficit de Atención e Hiperactividad): Patrones de inatención, hiperactividad o impulsividad que afectan la regulación de las tareas y el enfoque.
Dificultades específicas de aprendizaje: Como la dislexia (lectura), discalculia (matemáticas) o dispraxia (coordinación).
Otras variaciones: Incluyen el Síndrome de Tourette o la Alta Sensibilidad (PAS).


Rasgos principales a nivel cognitivo
Procesamiento sensorial: Mayor sensibilidad o hiposensibilidad a luces, ruidos, texturas o sabores.
Atención: Tendencia a la hiperconcentración en temas de profundo interés, alternada con dificultades para enfocarse en estímulos rutinarios.
Estilos de aprendizaje: Procesamiento de información más visual, holístico o asociativo frente a modelos lineales.


Las personas con un perfil neurodivergente suelen poseer fortalezas únicas, como una alta creatividad, pensamiento lateral o gran capacidad analítica.

Puedes encontrar más información detallada sobre este enfoque cognitivo en portales especializados como Understood.org o la Asociación Americana de Psicología

Text to CAD

CADAM Banner

⛮ The Open Source Text to CAD Web App ⛮

GitHub – Adam-CAD/CADAM: CADAM is the open source text-to-CAD web application · GitHub

📸 Demo

🎬 Try it live: https://adam.new/cadam

CADAM es una herramienta open-source (web app) de text-to-CAD que usa IA para generar y editar modelos 3D paramétricos a partir de descripciones en lenguaje natural (texto o voz). Funciona en el navegador con OpenSCAD (via WebAssembly), soporta OpenAI, Claude y Gemini, y permite:

  • Generar modelos desde prompts.
  • Editarlos iterativamente.
  • Ajustar parámetros con sliders.
  • Exportar como .SCAD, .STL o .DXF.

Live demo: adam.new/cadam
Repositorio: github.com/Adam-CAD/CADAM

Experimento Asch

El Experimento de Asch y la Conformidad

El experimento de Solomon Asch (realizado en la década de 1950) es uno de los estudios más clásicos y claros sobre el fenómeno de la conformidad social. Demuestra cómo las personas tienden a ajustarse a la opinión de un grupo mayoritario, incluso cuando esa opinión es claramente incorrecta.Procedimiento del experimento

  • Se decía a los participantes que estaban haciendo un test de percepción visual muy sencillo.
  • Se les mostraba una tarjeta con una línea estándar y otras tres líneas de diferente longitud (A, B y C). La tarea era decir cuál de las tres líneas tenía la misma longitud que la línea estándar.
  • La respuesta correcta era siempre obvia (era evidente a simple vista).
  • Cada participante respondía en voz alta, uno tras otro.
  • Importante: El participante real era el último en responder. Los demás (7-8 personas) eran cómplices del experimentador (confederados) que, a partir de cierto momento, daban respuestas incorrectas de forma unánime.

Resultados principales

  • Cuando respondían solos (sin presión grupal), los participantes se equivocaban menos del 1% de las veces.
  • Cuando había presión del grupo (los cómplices daban la respuesta equivocada):
    • Aproximadamente 75% de los participantes se conformaron al menos una vez.
    • En promedio, se conformaron en alrededor del 32-37% de los ensayos críticos.
  • Solo alrededor del 25% de las personas nunca se conformaron y siempre dieron la respuesta correcta.

¿Qué tipo de conformidad se produce?Asch distinguió dos motivos principales por los que la gente se conforma:

  1. Conformidad informativa: La persona cree que el grupo tiene razón y que su propia percepción está equivocada (“Si todos ven otra cosa, probablemente yo estoy equivocado”).
  2. Conformidad normativa (la más común en este experimento): La persona sabe que el grupo está equivocado, pero se calla o cambia su respuesta para no quedar como raro, evitar el rechazo o el ridículo social.

La mayoría de los que se conformaron en el experimento de Asch lo hicieron por presión normativa (querían encajar).Variaciones interesantes del experimento

  • Si había al menos un aliado (otra persona que daba la respuesta correcta), la conformidad bajaba drásticamente (alrededor del 5-10%).
  • Si el grupo no era unánime, la presión disminuía mucho.
  • Cuanto más grande era el grupo, mayor era la conformidad (hasta cierto punto; a partir de 4-5 personas el efecto se estabilizaba).

ImplicacionesEl experimento de Asch muestra que:

  • La necesidad de aceptación social es muy poderosa.
  • Incluso en tareas objetivas y sencillas, la presión grupal puede hacernos dudar de nuestros propios sentidos.
  • La conformidad no siempre es algo “malo” (en muchos contextos ayuda a la cohesión social), pero puede llevar a comportamientos irracionales o inmorales cuando el grupo se equivoca.

Este estudio es un pilar fundamental de la psicología social y se relaciona con otros fenómenos como la obediencia (experimento de Milgram), el pensamiento de grupo (Janis) o los efectos de las redes sociales actuales.

La noche blanca

La Noche Blanca es un gran evento cultural gratuito y abierto a toda la ciudadanía donde la ciudad entera se transforma en un escenario artístico continuo. Impulsada por primera vez en Burgos en 2008 como antesala a la Romería de la Virgen Blanca, su objetivo es acercar la cultura a la calle y ofrecer una alternativa de ocio nocturno diferente.

Propuesta de actividades

Durante esta velada, artistas de diversas disciplinas toman espacios públicos como parques, plazas, calles, centros de creación y teatros para presentar sus propuestas originales. Además, muchas instituciones y edificios del patrimonio histórico que habitualmente tienen el acceso restringido organizan de forma excepcional jornadas de puertas abiertas para los ciudadanos. La extensa programación incluye música, danza, teatro, magia, humor, ferias y escenografías de luces, arrancando por la tarde y prolongándose hasta la madrugada.

El ambiente en la ciudad

El Ayuntamiento describe el evento como una oportunidad activa para que el público descubra o redescubra Burgos desde una perspectiva muy diferente a la de su rutina cotidiana. A través de las intervenciones artísticas, la ciudad se muestra “coloreada y vestida de luz”, adoptando un carácter más festivo, humano y en ocasiones sorprendente por su poesía. En definitiva, es un proyecto con gran capacidad movilizadora que busca tanto la implicación de las estructuras culturales como la participación masiva de los burgaleses para disfrutar de una noche mágica.

Un pequeño empujón

“Un pequeño empujón” (Nudge: Improving Decisions about Health, Wealth, and Happiness) es un libro clave de economía conductual escrito por Richard H. Thaler (Premio Nobel de Economía) y Cass R. Sunstein. Propone el concepto de “nudge” (pequeño empujón): intervenciones sutiles en la arquitectura de las elecciones que guían a las personas hacia decisiones mejores para su salud, riqueza y felicidad, sin eliminar opciones ni alterar significativamente los incentivos económicos.

Defienden el paternalismo libertario: ayudar a las personas sin coaccionarlas.

El libro se estructura en partes (edición original de 2008 con ~16 capítulos).

A continuación, un resumen capítulo por capítulo, basado en la estructura principal y contenido clave.

Introducción

Los autores presentan el concepto central del empujón y la arquitectura de elecciones. Explican que las decisiones dependen de cómo se presentan las opciones. Gobiernos, empresas y personas actúan como “arquitectos de la elección”. Defienden el paternalismo libertario como vía intermedia entre laissez-faire y regulaciones estrictas.

Ejemplos: ordenar alimentos saludables en una cafetería o inscribir automáticamente en planes de pensiones (con opción de salida).

Parte I: Humanos y Economía

(Capítulos 1-4)

Explica las diferencias entre el Homo economicus (racional ideal) y los humanos reales, influenciados por sesgos.

Capítulo 1: Sesgos y errores — Introduce ilusiones visuales y cognitivas. Describe dos sistemas de pensamiento (Sistema Automático/intuitivo vs. Sistema Reflexivo/racional, similar a Kahneman). Analiza heurísticas y sesgos clave: anclaje, disponibilidad, representatividad, exceso de optimismo, aversión a la pérdida, status quo y efectos de marco. Las decisiones son predeciblemente irracionales y susceptibles a empujones.


Capítulo 2: Resistiendo la tentación — Explora la inconsistencia temporal (Planner vs. Doer). Las personas planean bien a largo plazo pero sucumben en el momento (estados “calientes”). Los empujones ayudan con reglas brillantes, compromisos previos y recordatorios.


Capítulo 3: Siguiendo al rebaño — Las personas se influyen por normas sociales y presión de pares. Ejemplos: conformidad (experimento Asch), información social y contagio. Los nudges pueden usar normas descriptivas e injuntivas para bien (ej. “la mayoría recicla”).


Capítulo 4: ¿Cuándo se necesita un nudge? — Identifica situaciones donde los nudges son útiles: decisiones poco frecuentes, sin retroalimentación inmediata, difíciles o con costos/beneficios diferidos. Principios: nudges deben ser fáciles de evitar y transparentes.

Parte II: Herramientas del arquitecto de elecciones (o Money – Capítulos 5-9 aprox.)

Enfocada en aplicaciones prácticas, especialmente finanzas.
ver también readingraphics.com

Capítulo 5: Arquitectura de la elección — Detalla cómo diseñar entornos de decisión (defaults, expectativas, mapeo, incentivos, retroalimentación). Los defaults son nudges poderosos porque la gente tiende a quedarse con la opción predeterminada.
Capítulo 6: Ahorrar más mañana (Save More Tomorrow) — Programa real exitoso: aumenta automáticamente las contribuciones a pensiones con subidas salariales. Combina compromiso previo y aversión a la pérdida.
Capítulo 7: Inversiones ingenuas — Sesgos en mercados: diversificación ingenua (1/n), exceso de trading, seguimiento de tendencias. Nudges: simplificar opciones, defaults diversificados, educación con advertencias.
Capítulo 8: Mercados de crédito — Problemas con tarjetas, hipotecas y préstamos. Nudges para disclosures claros, defaults de pago mínimo inteligente y recordatorios.
Capítulo 9: Privatizando la Seguridad Social estilo smorgasbord — Críticas a sistemas de elección complejos (ej. Suecia). Recomienda defaults, simplificación y curación de opciones.

Parte III: Salud (y otros temas sociales)

Capítulo 10: Medicamentos de prescripción (Part D) — Complejidad del programa Medicare Part D en EE.UU. Nudges: simplificación, defaults y herramientas de comparación.
Capítulo 11: Donación de órganos — Diferencias entre consentimiento presunto (opt-out, alta donación) vs. opt-in. Nudges como “expresar deseos” en licencias de conducir.
Capítulo 12: Salvar el planeta — Cambio climático. Nudges: divulgación de información energética, defaults verdes, normas sociales y feedback (ej. comparaciones de consumo).

Otros capítulos abordan temas como matrimonio, escuelas o privatizaciones, aplicando los mismos principios.

Parte IV: Conclusiones y extensionesLos autores responden críticas (¿manipulación?, ¿quién decide el “bien”?), enfatizan transparencia y libertad de elección. Discuten nudges en el sector privado y público, y la importancia de probar y evaluar (test, test, test). Ediciones posteriores agregan temas como “sludge” (fricciones que dificultan buenas decisiones).


Ideas clave generales del libro:

Los humanos no son completamente racionales → los empujones corrigen sesgos sin coacción.
Los valores predeterminados, simplificación, normas sociales y comentarios son herramientas potentes.
Aplicaciones en pensiones, salud, medio ambiente y finanzas personales/gubernamentales han demostrado gran impacto (ej. Save More Tomorrow aumentó ahorros significativamente).
Equilibrio: libertad + ayuda paternalista suave.

El libro está lleno de ejemplos reales y experimentos, y parece que haya influido en políticos (Obama, Cameron, etc.). Es una lectura esencial para entender toma de decisiones y diseño de políticas y conocimientos sobre el comportamiento. La edición final (2021), incluye actualizaciones.

otras referencias en cosimoenlosarboles.wordpress.com

Trabaja como un nórdico, vive como un mediterraneo

Resumen del libro Trabaja como un nórdico, vive como un mediterráneo. Los diez mandamientos para organizarte y alcanzar el equilibrio (Plataforma Editorial, mayo 2026).
plataformaeditorial.com

Autores y contextoAgustín Peralt y Joris Van Der Schoot.
Peralt es experto en efectividad personal, liderazgo y creador del Método FASE. El libro condensa años de experiencia trabajando con líderes y organizaciones en toda Europa.
fasemethod.com
El libro tiene 176 páginas y propone combinar lo mejor de dos mundos: la precisión, rigor, estructura y foco del norte de Europa con la pasión, capacidad relacional, disfrute y flexibilidad del sur (mediterráneo).
plataformaeditorial.com

Idea centralAnte la presión de trabajar más horas y más rápido (cultura del esfuerzo constante e hiperdisponibilidad), muchos líderes sacrifican energía, claridad y vida personal. Esto “funciona… hasta que deja de hacerlo”.
plataformaeditorial.com

La solución no es elegir entre productividad y vida, sino combinar ambas:Trabajar como un nórdico: Crear estructura, foco y método. Priorizar con intención, proteger la agenda y ser lo más eficiente posible.
Vivir como un mediterráneo: Cuidar la energía, las relaciones (su valor para la efectividad) y el disfrute consciente de la vida.

La clave: Usar la estructura para crear espacio y usar ese espacio para vivir mejor. Así se rinde al máximo de forma sostenible.
todostuslibros.com

Estructura del libroPrólogo (de Pol Codina, CEO de Food Ventures de PepsiCo).
Prefacio: “Ahogado en MI ambición”.
Introducción.
Introducción a los mandamientos.
Los 10 mandamientos.
Conclusión / último consejo para los líderes.

Los 10 mandamientos (títulos extraídos de fuentes)Lo que no está escrito no existe, lo que no está en tu agenda no se hace, lo que no se mide no se mejora.
content.e-bookshelf.de
El bienestar individual no depende solo del trabajo.
¿Flotas o navegas? La importancia de reflexionar y actuar con intención.
Reflexión, elección y foco radical en un mundo loco.
No gestionamos tiempo, gestionamos energía.
No nos falta tiempo, nos sobran distracciones.
La calidad de tus síes depende de la cantidad de tus noes.
Tu futuro se define por tus hábitos.
Las reuniones estructuradas uno a uno crean responsabilidad.
¿Eres un líder resiliente? Primero, demuéstrame que eres efectivo y productivo.
content.e-bookshelf.de
Los mandamientos integran herramientas prácticas del Método FASE (como priorización, agenda protegida, “Stop & Think”, Big Rocks, gestión de energía y hábitos).
content.e-bookshelf.de

Testimonios destacados (extractos reales)Mar Doñate (CEO Bimbo España): Destaca cómo ayuda a clarificar prioridades, gestionar energía y disfrutar el esfuerzo.
Otros directivos (Danone, ESADE, Vodafone, etc.) resaltan el impacto en foco, capacidad de decir “no”, liderazgo sostenible y equilibrio vida-trabajo.
content.e-bookshelf.de
Enfoque generalEl libro es práctico, con reflexión + acción. Critica tanto la rigidez excesiva como la falta de estructura, y ofrece un marco para líderes que quieren más claridad, impacto y vida plena. No se trata solo de productividad, sino de efectividad sostenible y autogestión.
instagram.com

Este resumen se basa exclusivamente en descripciones editoriales oficiales, fichas técnicas y extractos públicos disponibles (Plataforma Editorial, FASE Method y reseñas). No incluye contenido interno detallado de los capítulos ni interpretaciones inventadas.

primer mandamiento:

el primer mandamiento:«Lo que no está escrito no existe, lo que no está en tu agenda no se hace, lo que no se mide no se mejora.»Esta frase es el núcleo del mandamiento y se repite consistentemente en el material promocional del libro, artículos del blog de FASE Method y entrevistas con Agustín Peralt.
lavanguardia.com

Lo que se puede confirmar públicamente (sin inventar):El mandamiento enfatiza la necesidad de escribir y plasmar las prioridades, tareas y objetivos. Solo lo que se plasma por escrito existe de verdad (priorizar solo en la cabeza es una ilusión).
fasemethod.com
La agenda es sagrada: Lo que no está bloqueado en la agenda simplemente no se hace. La agenda “nunca miente”.
fasemethod.com
Medición: Lo que no se mide no mejora; se necesita seguimiento y revisión para generar progreso real.
Forma parte del Método FASE y se vincula a herramientas como la planificación semanal por escrito, “Big Rocks” (las piedras grandes/prioridades), bloqueo de tiempo y revisión periódica.

Este principio es uno de los más repetidos por Agustín Peralt en sus contenidos:

escribir = decidir de verdad; agenda = compromiso real; medición = mejora continua.

impostura

“Impostura” se define como fingimiento o engaño con apariencia de verdad, o como imputación falsa y maliciosa.

La Real Academia Española (RAE) establece dos acepciones principales para la palabra “impostura”: la primera es fingimiento o engaño con apariencia de verdad, es decir, una acción o dicho que pretende parecer verdadero aunque no lo sea, y la segunda es imputación falsa y maliciosa, que se refiere a acusaciones o calumnias dirigidas a dañar a alguien o algo con intención maliciosa. 


En términos prácticos, la impostura puede manifestarse como simulación, falsedad, farsa, comedia o superchería, y se utiliza tanto en contextos literarios como cotidianos para describir situaciones donde se pretende engañar o aparentar algo que no es real. 


Por ejemplo, en literatura o teatro, un personaje puede valerse de imposturas, gestos y otros ardides para crear un efecto cómico o dramático. Asimismo, en la vida diaria, se puede hablar de la impostura de alguien que finge conocimientos, sentimientos o intenciones para obtener algún beneficio o engañar a otros. 


En resumen, “impostura” implica siempre un elemento de engaño o falsedad, ya sea mediante fingimiento directo o mediante acusaciones maliciosas, y su uso se extiende desde la crítica social hasta la descripción de comportamientos individuales en distintos contextos. 

Real Academia Española