elicitation
Jul. 9th, 2025 01:05 pmЛюбопытная техника - как узнать информацию, не задав вопроса.
Недавно у меня произошёл диалог с Искусственным Интеллектом по похожей схеме - вместо вопроса я предложил свою версию описания реальности, и получил её разгром с кучей подробностей. Нельзя сказать, чтобы ИИ прям разрывался от нехватки внимания, но он часто настраивается специальной инструкцией (называемой system prompt), в которой могут быть ограничения - на вопросы какого типа не отвечать или уклоняться. Elicitation пока обходит такие ограничения, т.к. это же не вопрос - это исправление версии, предложенной собеседником. Своего рода эквивалент "не могу пойти спать - кто-то в интернете неправ!"
Удивительно, что с (в смысле "против") ИИ могут работать техники, о существовании которых он наверняка даже знает!
Недавно у меня произошёл диалог с Искусственным Интеллектом по похожей схеме - вместо вопроса я предложил свою версию описания реальности, и получил её разгром с кучей подробностей. Нельзя сказать, чтобы ИИ прям разрывался от нехватки внимания, но он часто настраивается специальной инструкцией (называемой system prompt), в которой могут быть ограничения - на вопросы какого типа не отвечать или уклоняться. Elicitation пока обходит такие ограничения, т.к. это же не вопрос - это исправление версии, предложенной собеседником. Своего рода эквивалент "не могу пойти спать - кто-то в интернете неправ!"
Удивительно, что с (в смысле "против") ИИ могут работать техники, о существовании которых он наверняка даже знает!
no subject
Date: 2025-07-09 01:48 pm (UTC)Скорее было бы удивительно, если б было наоборот. ИИ моделирован с человека, который на это ведется, как кот на валерьянку. Странно было бы, если бы модель себя вела иначе.
no subject
Date: 2025-07-09 05:32 pm (UTC)У модели нет мотива отвечать или не отвечать как-то. Ей через system prompt говорится, как себя вести, и где чего лишнего не сболтнуть (всякие неочевидные правила поведения, типа асимметрии расизма, например).
no subject
Date: 2025-07-09 11:27 pm (UTC)А как люди отвечают в такой ситуации? Вот именно.