Spaces:

junaid17
/

FinAI

No application file

App Files Files Community

FinAI / scripts /main.py

junaid17

Upload 13 files

ca67025 verified 14 days ago

raw

history blame contribute delete

4.04 kB

	from langgraph.graph import StateGraph, START, END
	from typing import TypedDict, Annotated
	from scripts.rag import RagPipeline
	from scripts.load_llm import get_model
	from langchain_openai import OpenAIEmbeddings, ChatOpenAI
	from langchain_core.messages import BaseMessage, HumanMessage, SystemMessage
	from langgraph.graph.message import add_messages
	from langgraph.checkpoint.memory import MemorySaver


	# Initialized Rag and llm
	RAG = None
	llm = get_model()

	def set_rag_instance(rag_instance):
	global RAG
	RAG = rag_instance

	# Initializing ChatState
	class ChatState(TypedDict):
	query: str
	retrieved_docs: list
	context: str
	use_rag: bool
	final_prompt: str
	sources: list


	# Making Nodes

	def retrieve_node(state):
	query = state["query"]

	docs = RAG.hybrid_retrieve(query=query, dense_k=3, top_k=3)

	return {"retrieved_docs": docs}


	def relevance_node(state):
	docs = state["retrieved_docs"]

	use_rag = False

	if docs:
	meaningful_docs = [
	d for d in docs
	if len(d.page_content.strip()) > 50
	]

	use_rag = len(meaningful_docs) > 0

	return {"use_rag": use_rag}


	def build_context_node(state):
	docs = state["retrieved_docs"]

	context = ""
	sources = []

	for doc in docs:
	source = doc.metadata.get("source", "unknown")
	page = doc.metadata.get("page", "unknown")

	sources.append({
	"document": source,
	"page": page
	})

	context += f"""
	SOURCE: {source}
	PAGE: {page}

	CONTENT:
	{doc.page_content}
	"""

	return {
	"context": context,
	"sources": sources
	}


	def rag_prompt_node(state):
	query = state["query"]
	context = state["context"]

	prompt = f"""
	You are a financial intelligence assistant.

	Use ONLY the provided context.

	If context is insufficient, say so.

	Context:
	{context}

	Question:
	{query}
	"""

	return {
	"final_prompt": prompt
	}

	def direct_prompt_node(state):
	query = state["query"]

	prompt = f"""
	You are a financial intelligence assistant.
	your job is to answer the user's question to the best of your ability.

	Question:
	{query}
	"""

	return {
	"final_prompt": prompt,
	"sources": []
	}

	def route_decision(state):
	if state["use_rag"]:
	return "build_context"

	return "direct_prompt"



	memory = MemorySaver()
	workflow = StateGraph(ChatState)

	workflow.add_node("retrieve", retrieve_node)
	workflow.add_node("relevance", relevance_node)
	workflow.add_node("build_context", build_context_node)
	workflow.add_node("rag_prompt", rag_prompt_node)
	workflow.add_node("direct_prompt", direct_prompt_node)

	workflow.set_entry_point("retrieve")

	workflow.add_edge("retrieve", "relevance")

	workflow.add_conditional_edges(
	"relevance",
	route_decision,
	{
	"build_context": "build_context",
	"direct_prompt": "direct_prompt"
	}
	)

	workflow.add_edge("build_context", "rag_prompt")
	workflow.add_edge("rag_prompt", END)
	workflow.add_edge("direct_prompt", END)

	graph_app = workflow.compile(checkpointer=memory)

	def stream_chat_response(user_message: str, thread_id: str):
	config = {
	"configurable": {
	"thread_id": thread_id
	}
	}

	state = graph_app.invoke(
	{"query": user_message},
	config=config
	)

	metadata = {
	"used_rag": state["use_rag"],
	"sources": state["sources"],
	"thread_id": thread_id
	}

	for chunk in llm.stream(
	[HumanMessage(content=state["final_prompt"])]
	):
	if chunk.content:
	yield {
	"token": chunk.content,
	"metadata": metadata
	}