Azure-Samples
diff --git a/‎.devcontainer/devcontainer.json
Lines changed: 6 additions & 1 deletion b/‎.devcontainer/devcontainer.json
Lines changed: 6 additions & 1 deletion
diff --git a/‎.env.sample
Lines changed: 10 additions & 3 deletions b/‎.env.sample
Lines changed: 10 additions & 3 deletions
diff --git a/‎.github/workflows/app-tests.yaml
Lines changed: 2 additions & 2 deletions b/‎.github/workflows/app-tests.yaml
Lines changed: 2 additions & 2 deletions
diff --git a/‎.github/workflows/evaluate.yaml
Lines changed: 1 addition & 1 deletion b/‎.github/workflows/evaluate.yaml
Lines changed: 1 addition & 1 deletion
diff --git a/‎evals/evaluate.py
Lines changed: 4 additions & 0 deletions b/‎evals/evaluate.py
Lines changed: 4 additions & 0 deletions
diff --git a/‎evals/generate_ground_truth.py
Lines changed: 3 additions & 1 deletion b/‎evals/generate_ground_truth.py
Lines changed: 3 additions & 1 deletion
diff --git a/‎evals/safety_evaluation.py
Lines changed: 21 additions & 19 deletions b/‎evals/safety_evaluation.py
Lines changed: 21 additions & 19 deletions
diff --git a/‎infra/main.bicep
Lines changed: 1 addition & 1 deletion b/‎infra/main.bicep
Lines changed: 1 addition & 1 deletion
diff --git a/‎pyproject.toml
Lines changed: 0 additions & 1 deletion b/‎pyproject.toml
Lines changed: 0 additions & 1 deletion
diff --git a/‎src/backend/fastapi_app/__init__.py
Lines changed: 8 additions & 1 deletion b/‎src/backend/fastapi_app/__init__.py
Lines changed: 8 additions & 1 deletion
diff --git a/‎src/backend/fastapi_app/api_models.py
Lines changed: 54 additions & 22 deletions b/‎src/backend/fastapi_app/api_models.py
Lines changed: 54 additions & 22 deletions
diff --git a/‎src/backend/fastapi_app/dependencies.py
Lines changed: 8 additions & 0 deletions b/‎src/backend/fastapi_app/dependencies.py
Lines changed: 8 additions & 0 deletions
@@ -29,13 +29,18 @@
 			"extensions": [
 				"ms-python.python",
 				"ms-python.vscode-pylance",
+				"ms-python.vscode-python-envs",
 				"charliermarsh.ruff",
 				"mtxr.sqltools",
 				"mtxr.sqltools-driver-pg",
+				"esbenp.prettier-vscode",
+				"mechatroner.rainbow-csv",
 				"ms-vscode.vscode-node-azure-pack",
 				"esbenp.prettier-vscode",
 				"twixes.pypi-assistant",
-				"ms-python.vscode-python-envs"
+				"ms-python.vscode-python-envs",
+				"teamsdevapp.vscode-ai-foundry",
+				"ms-windows-ai-studio.windows-ai-studio"
 			],
 			// Set *default* container specific settings.json values on container create.
 			"settings": {
 
@@ -5,9 +5,9 @@ POSTGRES_PASSWORD=postgres
 POSTGRES_DATABASE=postgres
 POSTGRES_SSL=disable
 
-# OPENAI_CHAT_HOST can be either azure, openai, or ollama:
+# OPENAI_CHAT_HOST can be either azure, openai, ollama, or github:
 OPENAI_CHAT_HOST=azure
-# OPENAI_EMBED_HOST can be either azure or openai:
+# OPENAI_EMBED_HOST can be either azure, openai, ollama, or github:
 OPENAI_EMBED_HOST=azure
 # Needed for Azure:
 # You also need to `azd auth login` if running this locally
@@ -28,10 +28,17 @@ AZURE_OPENAI_KEY=
 OPENAICOM_KEY=YOUR-OPENAI-API-KEY
 OPENAICOM_CHAT_MODEL=gpt-3.5-turbo
 OPENAICOM_EMBED_MODEL=text-embedding-3-large
-OPENAICOM_EMBED_MODEL_DIMENSIONS=1024
+OPENAICOM_EMBED_DIMENSIONS=1024
 OPENAICOM_EMBEDDING_COLUMN=embedding_3l
 # Needed for Ollama:
 OLLAMA_ENDPOINT=http://host.docker.internal:11434/v1
 OLLAMA_CHAT_MODEL=llama3.1
 OLLAMA_EMBED_MODEL=nomic-embed-text
 OLLAMA_EMBEDDING_COLUMN=embedding_nomic
+# Needed for GitHub Models:
+GITHUB_TOKEN=YOUR-GITHUB-TOKEN
+GITHUB_BASE_URL=https://models.inference.ai.azure.com
+GITHUB_MODEL=gpt-4o
+GITHUB_EMBED_MODEL=text-embedding-3-large
+GITHUB_EMBED_DIMENSIONS=1024
+GITHUB_EMBEDDING_COLUMN=embedding_3l
@@ -85,7 +85,7 @@ jobs:
             architecture: x64
 
         - name: Install uv
-          uses: astral-sh/setup-uv@v5
+          uses: astral-sh/setup-uv@v6
           with:
             enable-cache: true
             version: "0.4.20"
@@ -123,7 +123,7 @@ jobs:
             key: mypy${{ matrix.os }}-${{ matrix.python_version }}-${{ hashFiles('requirements-dev.txt', 'src/backend/requirements.txt', 'src/backend/pyproject.toml') }}
 
         - name: Run MyPy
-          run: python3 -m mypy .
+          run: python3 -m mypy . --python-version ${{ matrix.python_version }}
 
         - name: Run Pytest
           run: python3 -m pytest -s -vv --cov --cov-fail-under=85
 
@@ -82,7 +82,7 @@ jobs:
           python-version: '3.12'
 
       - name: Install uv
-        uses: astral-sh/setup-uv@v5
+        uses: astral-sh/setup-uv@v6
         with:
           enable-cache: true
           version: "0.4.20"
 
@@ -66,6 +66,10 @@ def get_openai_config() -> dict:
             # azure-ai-evaluate will call DefaultAzureCredential behind the scenes,
             # so we must be logged in to Azure CLI with the correct tenant
         openai_config["model"] = os.environ["AZURE_OPENAI_EVAL_MODEL"]
+    elif os.environ.get("OPENAI_CHAT_HOST") == "ollama":
+        raise NotImplementedError("Ollama is not supported. Switch to Azure or OpenAI.com")
+    elif os.environ.get("OPENAI_CHAT_HOST") == "github":
+        raise NotImplementedError("GitHub Models is not supported. Switch to Azure or OpenAI.com")
     else:
         logger.info("Using OpenAI Service with API Key from OPENAICOM_KEY")
         openai_config = {"api_key": os.environ["OPENAICOM_KEY"], "model": "gpt-4"}
 
@@ -101,7 +101,9 @@ def get_openai_client() -> tuple[Union[AzureOpenAI, OpenAI], str]:
             )
         model = os.environ["AZURE_OPENAI_CHAT_DEPLOYMENT"]
     elif OPENAI_CHAT_HOST == "ollama":
-        raise NotImplementedError("Ollama OpenAI Service is not supported. Switch to Azure or OpenAI.com")
+        raise NotImplementedError("Ollama is not supported. Switch to Azure or OpenAI.com")
+    elif OPENAI_CHAT_HOST == "github":
+        raise NotImplementedError("GitHub Models is not supported. Switch to Azure or OpenAI.com")
     else:
         logger.info("Using OpenAI Service with API Key from OPENAICOM_KEY")
         openai_client = OpenAI(api_key=os.environ["OPENAICOM_KEY"])
 
@@ -1,9 +1,11 @@
 import argparse
 import asyncio
+import datetime
 import logging
 import os
 import pathlib
 import sys
+from typing import Optional
 
 import requests
 from azure.ai.evaluation import AzureAIProject
@@ -52,7 +54,7 @@ async def callback(
     return {"messages": messages + [message]}
 
 
-async def run_simulator(target_url: str, max_simulations: int):
+async def run_simulator(target_url: str, max_simulations: int, scan_name: Optional[str] = None):
     credential = get_azure_credential()
     azure_ai_project: AzureAIProject = {
         "subscription_id": os.getenv("AZURE_SUBSCRIPTION_ID"),
@@ -64,26 +66,25 @@ async def run_simulator(target_url: str, max_simulations: int):
         credential=credential,
         risk_categories=[
             RiskCategory.Violence,
-            # RiskCategory.HateUnfairness,
-            # RiskCategory.Sexual,
-            # RiskCategory.SelfHarm,
+            RiskCategory.HateUnfairness,
+            RiskCategory.Sexual,
+            RiskCategory.SelfHarm,
         ],
         num_objectives=1,
     )
+    if scan_name is None:
+        timestamp = datetime.datetime.now().strftime("%Y-%m-%d_%H-%M-%S")
+        scan_name = f"Safety evaluation {timestamp}"
     await model_red_team.scan(
         target=lambda messages, stream=False, session_state=None, context=None: callback(messages, target_url),
-        scan_name="Advanced-Callback-Scan",
+        scan_name=scan_name,
         attack_strategies=[
-            AttackStrategy.EASY,  # Group of easy complexity attacks
-            # AttackStrategy.MODERATE,  # Group of moderate complexity attacks
-            # AttackStrategy.CharacterSpace,  # Add character spaces
-            # AttackStrategy.ROT13,  # Use ROT13 encoding
-            # AttackStrategy.UnicodeConfusable,  # Use confusable Unicode characters
-            # AttackStrategy.CharSwap,  # Swap characters in prompts
-            # AttackStrategy.Morse,  # Encode prompts in Morse code
-            # AttackStrategy.Leetspeak,  # Use Leetspeak
-            # AttackStrategy.Url,  # Use URLs in prompts
-            # AttackStrategy.Binary,  # Encode prompts in binary
+            AttackStrategy.DIFFICULT,
+            AttackStrategy.Baseline,
+            AttackStrategy.UnicodeConfusable,  # Use confusable Unicode characters
+            AttackStrategy.Morse,  # Encode prompts in Morse code
+            AttackStrategy.Leetspeak,  # Use Leetspeak
+            AttackStrategy.Url,  # Use URLs in prompts
         ],
         output_path="Advanced-Callback-Scan.json",
     )
@@ -97,28 +98,29 @@ async def run_simulator(target_url: str, max_simulations: int):
     parser.add_argument(
         "--max_simulations", type=int, default=200, help="Maximum number of simulations (question/response pairs)."
     )
+    # argument for the name
+    parser.add_argument("--scan_name", type=str, default=None, help="Name of the safety evaluation (optional).")
     args = parser.parse_args()
 
     # Configure logging to show tracebacks for warnings and above
     logging.basicConfig(
-        level=logging.DEBUG,
+        level=logging.WARNING,
         format="%(message)s",
         datefmt="[%X]",
         handlers=[RichHandler(rich_tracebacks=False, show_path=True)],
     )
 
     # Set urllib3 and azure libraries to WARNING level to see connection issues
     logging.getLogger("urllib3").setLevel(logging.WARNING)
-    logging.getLogger("azure").setLevel(logging.DEBUG)
-    logging.getLogger("RedTeamLogger").setLevel(logging.DEBUG)
+    logging.getLogger("azure").setLevel(logging.WARNING)
 
     # Set our application logger to INFO level
     logger.setLevel(logging.INFO)
 
     load_azd_env()
 
     try:
-        asyncio.run(run_simulator(args.target_url, args.max_simulations))
+        asyncio.run(run_simulator(args.target_url, args.max_simulations, args.scan_name))
     except Exception:
         logging.exception("Unhandled exception in safety evaluation")
         sys.exit(1)
@@ -302,7 +302,7 @@ var webAppEnv = union(azureOpenAIKeyEnv, openAIComKeyEnv, [
     value: openAIEmbedHost
   }
   {
-    name: 'OPENAICOM_EMBED_MODEL_DIMENSIONS'
+    name: 'OPENAICOM_EMBED_DIMENSIONS'
     value: openAIEmbedHost == 'openaicom' ? '1024' : ''
   }
   {
 
@@ -7,7 +7,6 @@ lint.isort.known-first-party = ["fastapi_app"]
 
 [tool.mypy]
 check_untyped_defs = true
-python_version = 3.9
 exclude = [".venv/*"]
 
 [tool.pytest.ini_options]
 
@@ -34,7 +34,13 @@ class State(TypedDict):
 @asynccontextmanager
 async def lifespan(app: fastapi.FastAPI) -> AsyncIterator[State]:
     context = await common_parameters()
-    azure_credential = await get_azure_credential()
+    azure_credential = None
+    if (
+        os.getenv("OPENAI_CHAT_HOST") == "azure"
+        or os.getenv("OPENAI_EMBED_HOST") == "azure"
+        or os.getenv("POSTGRES_HOST", "").endswith(".database.azure.com")
+    ):
+        azure_credential = await get_azure_credential()
     engine = await create_postgres_engine_from_env(azure_credential)
     sessionmaker = await create_async_sessionmaker(engine)
     chat_client = await create_openai_chat_client(azure_credential)
@@ -53,6 +59,7 @@ def create_app(testing: bool = False):
         if not testing:
             load_dotenv(override=True)
         logging.basicConfig(level=logging.INFO)
+
     # Turn off particularly noisy INFO level logs from Azure Core SDK:
     logging.getLogger("azure.core.pipeline.policies.http_logging_policy").setLevel(logging.WARNING)
     logging.getLogger("azure.identity").setLevel(logging.WARNING)
 
@@ -1,8 +1,8 @@
 from enum import Enum
 from typing import Any, Optional
 
-from openai.types.chat import ChatCompletionMessageParam
-from pydantic import BaseModel
+from openai.types.responses import ResponseInputItemParam
+from pydantic import BaseModel, Field
 
 
 class AIChatRoles(str, Enum):
@@ -36,19 +36,39 @@ class ChatRequestContext(BaseModel):
 
 
 class ChatRequest(BaseModel):
-    messages: list[ChatCompletionMessageParam]
+    messages: list[ResponseInputItemParam]
     context: ChatRequestContext
     sessionState: Optional[Any] = None
 
 
+class ItemPublic(BaseModel):
+    id: int
+    type: str
+    brand: str
+    name: str
+    description: str
+    price: float
+
+    def to_str_for_rag(self):
+        return f"Name:{self.name} Description:{self.description} Price:{self.price} Brand:{self.brand} Type:{self.type}"
+
+
+class ItemWithDistance(ItemPublic):
+    distance: float
+
+    def __init__(self, **data):
+        super().__init__(**data)
+        self.distance = round(self.distance, 2)
+
+
 class ThoughtStep(BaseModel):
     title: str
     description: Any
     props: dict = {}
 
 
 class RAGContext(BaseModel):
-    data_points: dict[int, dict[str, Any]]
+    data_points: dict[int, ItemPublic]
     thoughts: list[ThoughtStep]
     followup_questions: Optional[list[str]] = None
 
@@ -69,27 +89,39 @@ class RetrievalResponseDelta(BaseModel):
     sessionState: Optional[Any] = None
 
 
-class ItemPublic(BaseModel):
-    id: int
-    type: str
-    brand: str
-    name: str
-    description: str
-    price: float
-
-
-class ItemWithDistance(ItemPublic):
-    distance: float
-
-    def __init__(self, **data):
-        super().__init__(**data)
-        self.distance = round(self.distance, 2)
-
-
 class ChatParams(ChatRequestOverrides):
     prompt_template: str
     response_token_limit: int = 1024
     enable_text_search: bool
     enable_vector_search: bool
     original_user_query: str
-    past_messages: list[ChatCompletionMessageParam]
+    past_messages: list[ResponseInputItemParam]
+
+
+class Filter(BaseModel):
+    column: str
+    comparison_operator: str
+    value: Any
+
+
+class PriceFilter(Filter):
+    column: str = Field(default="price", description="The column to filter on (always 'price' for this filter)")
+    comparison_operator: str = Field(description="The operator for price comparison ('>', '<', '>=', '<=', '=')")
+    value: float = Field(description="The price value to compare against (e.g., 30.00)")
+
+
+class BrandFilter(Filter):
+    column: str = Field(default="brand", description="The column to filter on (always 'brand' for this filter)")
+    comparison_operator: str = Field(description="The operator for brand comparison ('=' or '!=')")
+    value: str = Field(description="The brand name to compare against (e.g., 'AirStrider')")
+
+
+class SearchResults(BaseModel):
+    query: str
+    """The original search query"""
+
+    items: list[ItemPublic]
+    """List of items that match the search query and filters"""
+
+    filters: list[Filter]
+    """List of filters applied to the search results"""
@@ -51,6 +51,11 @@ async def common_parameters():
         openai_embed_model = os.getenv("OLLAMA_EMBED_MODEL") or "nomic-embed-text"
         openai_embed_dimensions = None
         embedding_column = os.getenv("OLLAMA_EMBEDDING_COLUMN") or "embedding_nomic"
+    elif OPENAI_EMBED_HOST == "github":
+        openai_embed_deployment = None
+        openai_embed_model = os.getenv("GITHUB_EMBED_MODEL") or "text-embedding-3-large"
+        openai_embed_dimensions = int(os.getenv("GITHUB_EMBED_DIMENSIONS", 1024))
+        embedding_column = os.getenv("GITHUB_EMBEDDING_COLUMN") or "embedding_3l"
     else:
         openai_embed_deployment = None
         openai_embed_model = os.getenv("OPENAICOM_EMBED_MODEL") or "text-embedding-3-large"
@@ -63,6 +68,9 @@ async def common_parameters():
         openai_chat_deployment = None
         openai_chat_model = os.getenv("OLLAMA_CHAT_MODEL") or "phi3:3.8b"
         openai_embed_model = os.getenv("OLLAMA_EMBED_MODEL") or "nomic-embed-text"
+    elif OPENAI_CHAT_HOST == "github":
+        openai_chat_deployment = None
+        openai_chat_model = os.getenv("GITHUB_MODEL") or "gpt-4o"
     else:
         openai_chat_deployment = None
         openai_chat_model = os.getenv("OPENAICOM_CHAT_MODEL") or "gpt-3.5-turbo"
Original file line number	Diff line number	Diff line change
`@@ -302,7 +302,7 @@ var webAppEnv = union(azureOpenAIKeyEnv, openAIComKeyEnv, [`
`302`	`302`	`value: openAIEmbedHost`
`303`	`303`	`}`
`304`	`304`	`{`
`305`		`- name: 'OPENAICOM_EMBED_MODEL_DIMENSIONS'`
	`305`	`+ name: 'OPENAICOM_EMBED_DIMENSIONS'`
`306`	`306`	`value: openAIEmbedHost == 'openaicom' ? '1024' : ''`
`307`	`307`	`}`
`308`	`308`	`{`